콘텐츠로 이동

HW-DISK-ERROR

설명: I/O Error전예측되는증상의로그(미러 구성이 아닐경우 데이터 소실됨)

스크린샷 2024-04-29 오전 11.23.08.png

  • Kage, Tenth 서비스는 해당 서비스 스크립트로 처리
kagedisk.sh
  • AHCI가 지원되는 장치 : Hot Plug 기능으로 온라인 디스크 교체
  • AHCI가 지원되지 않는 구형 장치 : 서버 OFF 후 디스크 교체
  • : tb info disk 확인 시 Controller → AHCI mode 또는 RAID 0 구성되어 있다면 AHCI 지원
  1. System log 확인

→ 장애 로그 : kernel: blk_update_request: I/O error, dev sdd, sector 101924506

  1. 해당 디스크 error count 확인
tb info smart
smartctl -a /dev/sd(x)
  1. 담당 SE를 통한 서비스 제외 확인
디스크 온라인 교체서버 OFF 후 교체
4. 해당 디스크 umount 확인 (# df) → # umount /dev/sd(x)14. fstab 해당 영역 주석(#) 처리 (# vi /etc/fstab)
5. 해당 디스크 교체5. 서버 OFF (# poweroff)
6. 파티션 생성 (# tb d part /dev/sd(X) 1)6. 해당 디스크 교체 후 서버 ON
7. 파일 시스템 생성 (# mfks.xfs /dev/sd(x)1)7. 파티션 생성 (# tb d part /dev/sd(x) 1)
8. 교체한 디스크 device uuid 변경 (# blkid)파일 시스템 생성 (# mfks.xfs /dev/sd(x)1)
9. 해당 device uuid 변경 (# vi /etc/fstab)9. 교체한 디스크 device uuid 롹인 (# blkid)
10. 디스크 mount (# mount-a)10. 해당 device uuid 변경 및 주석 해제 (# vi /etc/fstab)
11. 교체 영역 mount 확인, 담당 SE 전달 및 종료11. 디스크 mount (# mount-a)
12. 교체 영역 mount 확인, 담당 SE 전달 및 종료

/dev/sdd (해당 슬롯) 영역 디스크 I/O error 발생하여 해당 스크립트 (kage or tenth)로 교체 후 정상 확인