HW-DISK-ERROR
설명: I/O Error전예측되는증상의로그(미러구성이아닐경우데이터소실됨)

- Kage, Tenth 서비스는 해당 서비스 스크립트로 처리
- AHCI가 지원되는 장치 : Hot Plug 기능으로 온라인 디스크 교체
- AHCI가 지원되지 않는 구형 장치 : 서버 OFF 후 디스크 교체
- : tb info disk 확인 시 Controller → AHCI mode 또는 RAID 0 구성되어 있다면 AHCI 지원
처리 순서
섹션 제목: “처리 순서”- System log 확인
→ 장애 로그 : kernel: blk_update_request: I/O error, dev sdd, sector 101924506
- 해당 디스크 error count 확인
- tb info smart
- smartctl -a /dev/sd(x)
- 담당 SE를 통한 서비스 제외 확인
| 디스크 온라인 교체 | 서버 OFF 후 교체 |
|---|---|
| 4. 해당 디스크 umount 확인 (# df) → # umount /dev/sd(x)1 | 4. fstab 해당 영역 주석(#) 처리 (# vi /etc/fstab) |
| 5. 해당 디스크 교체 | 5. 서버 OFF (# poweroff) |
| 6. 파티션 생성 (# tb d part /dev/sd(X) 1) | 6. 해당 디스크 교체 후 서버 ON |
| 7. 파일 시스템 생성 (# mfks.xfs /dev/sd(x)1) | 7. 파티션 생성 (# tb d part /dev/sd(x) 1) |
| 8. 교체한 디스크 device uuid 변경 (# blkid) | 파일 시스템 생성 (# mfks.xfs /dev/sd(x)1) |
| 9. 해당 device uuid 변경 (# vi /etc/fstab) | 9. 교체한 디스크 device uuid 롹인 (# blkid) |
| 10. 디스크 mount (# mount-a) | 10. 해당 device uuid 변경 및 주석 해제 (# vi /etc/fstab) |
| 11. 교체 영역 mount 확인, 담당 SE 전달 및 종료 | 11. 디스크 mount (# mount-a) |
| 12. 교체 영역 mount 확인, 담당 SE 전달 및 종료 |
티켓 처리 문구
섹션 제목: “티켓 처리 문구”/dev/sdd (해당 슬롯) 영역 디스크 I/O error 발생하여 해당 스크립트 (kage or tenth)로 교체 후 정상 확인