HW-MC-ERROR
작성 일시: 2024년 5월 30일 오후 1:49 태그: TMS[장애대처], 데일리
작업 순서
섹션 제목: “작업 순서”- 티켓 발행

- 서비스 OFF 가 필요한 메모리 장애 이기 때문에 요청 올때까지 티켓 돌림

-
영역 장애 확인 후 담장자에게 개인 연락(워크)으로 교체 가능 여부 전달
-
교체할 파트 스팩 확인
- 2666v
- 32G
-
작업등록
-
작업등록
-
작업등록
-
상면이동
-
서버 케이블 연결 해제 후 파트 교체 진행
-
만약 영역 정보가 없다면 다음의 방법으로 알아볼 수 있음
- grep [0-9] /sys/devices/system/edac/mc/mc*/csrow*/ch* 명령어를 통한 영역 확인
- IPMI 접속을 통한 메모리 영역 확인
- 등….
-
파트 교체 후 서버 마운트 및 케이블 연결
-
자동으로 전원 올라오면 OK, 안올라오면 전원버튼 눌러주기
-
sys-gate 에서 아래 명령어들을 통해 연결 확인. (mping은 계-속 핑 때리는거 / pping 는 한번만 때리는거)
- mping [호스트네임]
- pping [호스트네임]
-
연결 확인되면 원격 접속 후 아래 명령어를 통해 교체 위치에 메모리 정상 인식하는지 확인
- tb info memory
- 또는
- tb info mem
-
작업완료 후 장애처리 상세등록 진행

- IPMI 로 접속해서 LOG 기록 남아있다면 지워주기.
- IPMI 로 접속해서 LOG 기록 남아있다면 지워주기.
- IPMI 로 접속해서 LOG 기록 남아있다면 지워주기.
있었던 일
섹션 제목: “있었던 일”- bb
해야할 일
섹션 제목: “해야할 일”- 작업등록 해볼 기회가 있으면 기억하고 기록하기