>  기사  >  시스템 튜토리얼  >  CentOS에서 SSD 상태 및 수명을 감지하는 방법에 대한 자세한 설명

CentOS에서 SSD 상태 및 수명을 감지하는 방법에 대한 자세한 설명

WBOY
WBOY앞으로
2024-01-08 13:18:201068검색

인터넷 전체에서 하드드라이브 수명 데이터를 확인할 수 있는 것은 인텔 SSD뿐입니다. 저처럼 Crucial과 OCZ만 사용할 수 있는 가난한 사용자에게는 정말 불공평합니다. RAID 카드. 판매자의 SSD 수명이 다했나요?

몇 가지 연구 끝에 SSD를 보는 모든 명령은 RAID를 통과하는 한 SSD 디스크 사용량을 얻기 위해 MegaCli 및 smartCtl을 사용해야 합니다. 주의 깊게 조사한 결과 현재

를 사용하고 있습니다.

RAID 카드는 LSI Logic / Symbios Logic MegaRAID SAS 1078 및 2108입니다. 일반적인 MegaCli를 사용하여 쿼리합니다.

다운로드 주소는 다음과 같습니다.

Centos5용 MegaCli

Centos6용 MegaCli

전체 프로세스는 두 단계로 나누어집니다. 첫 번째 단계는 RAID 카드에서 다음 하드 디스크 정보를 얻는 것입니다. 다음으로 smartCtl을 사용하여 자세한 하드 디스크 정보를 표시합니다.

MegaCli를 사용하여 RAID 카드 아래의 하드 드라이브 정보를 얻습니다.

그런 다음 다음 명령을 사용하세요.

/opt/MegaRAID/MegaCli/MegaCli64 -PDList -aALL

이렇게 하면 RAID 카드 아래의 내용을 확인할 수 있습니다.

인클로저 장치 ID: 252

슬롯 번호: 7

장치 ID: 28

순서번호: 2

미디어 오류 수: 0

기타 오류 수: 1

예측 실패 횟수: 0

마지막 예측 실패 이벤트 일련 번호: 0

PD 유형: SATA

원시 크기: 119.242GB [0xee7c2b0 섹터]

강제되지 않은 크기: 118.742GB [0xed7c2b0 섹터]

강제된 크기: 118.277GB [0xec8e000 섹터]

펌웨어 상태: 온라인, 회전

SAS 주소(0): 0x1e394d57aa996b80

연결된 포트 번호: 7(path0)

문의 데이터: 0000000011070303A99EC300-CTFDDAC128MAG        0007 

FDE 가능: 불가능

FDE 활성화: 비활성화

보안됨: 보안되지 않음

잠김: 잠금 해제됨

EKM 주의 필요: 아니요

외국: 없음

장치 속도: 6.0Gb/s

링크 속도: 1.5Gb/s

미디어 유형: 고체 장치

위 위치에 주의하세요. 미디어 유형: 솔리드 스테이트 장치만 이는 SSD임을 의미합니다. 이는 나중에 smartctl을 사용하여 쿼리할 때 기록해야 합니다. 위에 표시된 하드 드라이브 모델을 볼 수 있습니다: 문의 데이터: 0000000011070303A99EC300-CTFDDAC128MAG             0007. 이 SSD가 정상인지 알려주는 표시도 있습니다. 온라인, 이 옵션을 실행하면 됩니다. 모니터링 및 알람, 기본적으로 이 매개변수를 직접 모니터링하는 것으로 충분합니다.

smartctl을 사용하여 SSD 하드 드라이브에 대한 자세한 정보를 얻으세요

제조업체마다 디스크 종류에 따라 정보가 다르다는 점에 유의하세요. Intel의 하드 디스크 정보는 소개되지 않습니다. 그 중 -a는 모든 정보를 표시하는 데 사용되는 명령입니다. . -d는 하드 디스크를 설정하는 데 사용됩니다. 이때 RAID 카드마다 사용하는 인터페이스가 다를 수 있으므로 약간의 차이가 있을 수 있다는 점에 유의해야 합니다.

예를 들어 Intel 하드 드라이브의 경우 -d megaraid, 27을 사용하면 정상적으로 작동합니다. 하지만 위의 RAID 카드를 사용한 후에는 sat 매개변수를 지정해야 하며 다음과 같이 됩니다.

smartctl -a -d sat+megaraid,27 /dev/sdb1 -s on

위의 sat는 SCSI에서 ATA로 변환된 장치를 의미하며 scsi, ata 등의 매개변수를 추가할 수 있습니다.

이때 다음 정보가 표시됩니다:

모델 제품군: Crucial/Micron RealSSD C300/C400

장치 모델: C300-CTFDDAC128MAG

SMART 속성 데이터 구조 개정 번호: 16

임계값이 있는 공급업체별 SMART 속성:

ID # ATTRIBUTE_NAME 플래그 값 최악의 임계값 유형이 업데이트됨 WHEN_FAILED RAW_VALUE

1 Raw_Read_Error_Rate 0x002f 100 100 000 사전 실패 항상 - - 0

5 Reallocation_Sector_Ct 0x0033 100 100 000 사전 실패 항상 - - 0

9 Power_On_Hours 0x0032 100 100 000 Old_age 항상 - 5572

12 Power_Cycle_Count 0x0032 100 100 000 Old_age 항상 - 3

170 Grown_Failing_Block_Ct  0x0033   100   100   000    사전 실패  항상       -       0

171 Program_Fail_Count      0x0032   100   100   000    Old_age   항상       -       0

172 Erase_Fail_Count        0x0032   100   100   000    Old_age   항상       -       0

173 Wear_Levelling_Count    0x0033   090   090   000    사전 실패  항상       -       536

174 Unexpect_Power_Loss_Ct  0x0032   100   100   000    Old_age   항상       -       1

181 Non4k_Aligned_Access    0x0022   100   100   000    Old_age   항상       -       0 0 0

183 SATA_Iface_Downshift    0x0032   100   100   000    Old_age   항상       -       0

184 End-to-End_Error        0x0033   100   100   000    사전 실패  항상       -      0

187 보고된_부정확함      0x0032   100   100   000    Old_age   항상       -       0

188 Command_Timeout         0x0032   100   100   000    Old_age   항상       -       0

189 Factory_Bad_Block_Ct    0x000e   100   100   000    Old_age   항상       -       250

195 Hardware_ECC_Recovered  0x003a   100   100   000    Old_age   항상       -       0

196 Realowned_Event_Count 0x0032   100   100   000    Old_age   항상       -       0

197 Current_Pending_Sector  0x0032   100   100   000    Old_age   항상       -       0

198 Offline_수정 불가능   0x0030   100   100   000    Old_age   오프라인      -       0

199 UDMA_CRC_Error_Count    0x0036   100   100   000    Old_age   항상       -       0

202 Perc_Rated_Life_Used    0x0018   090   090   000    Old_age   오프라인      -       10

206 Write_Error_Rate        0x000e   100   100   000    Old_age   항상       -       0

如果是 OCZ 의:

기기 모델:     OCZ-AGILITY3

일련번호:    OCZ-1OX963Q8B5X2V684

SMART 속성 데이터 구조 개정 번호: 10

임계값이 있는 공급업체별 SMART 속성:

ID# ATTRIBUTE_NAME          플래그     값 최악의 임계값 유형      업데이트됨  RAW_VALUE

1 Raw_Read_Error_Rate     0x000f   086   086   050    사전 실패  항상       -       135388659

5 Reallocation_Sector_Ct   0x0033   100   100   003    사전 실패  항상       -       9

9 Power_On_Hours          0x0032   100   100   000    Old_age   항상       -       265772576277126

12 Power_Cycle_Count       0x0032   100   100   000    Old_age   항상       -       15

171 Unknown_Attribute       0x0032   000   000   000    Old_age   항상       -       9

172 Unknown_Attribute       0x0032   000   000   000    Old_age   항상       -       0

174 Unknown_Attribute       0x0030   000   000   000    Old_age   오프라인      -       13

177 Wear_Leveling_Count     0x0000   000   000   000    Old_age   오프라인      -       1

181 Program_Fail_Cnt_Total  0x0032   000   000   000    Old_age   항상       -       9

182 Erase_Fail_Count_Total  0x0032   000   000   000    Old_age   항상       -       0

187 보고된_부정확함      0x0032   100   100   000    Old_age   항상       -       0

194 온도_섭씨     0x0022   030   030   000    Old_age   항상       -       30(수명 최소/최대 30/30)

195 Hardware_ECC_Recovered  0x001c   120   120   000    Old_age   오프라인      -       135388659

196 Realowned_Event_Count 0x0033   100   100   003    사전 실패  항상       -       9

201 Soft_Read_Error_Rate    0x001c   120   120   000    Old_age   오프라인      -       135388659

204 Soft_ECC_Correction     0x001c   120   120   000    Old_age   오프라인      -       135388659

230 Head_Amplitude          0x0013   100   100   000    사전 실패  항상       -       100

231 온도_섭씨     0x0013   100   100   010    사전 실패  항상       -       0

233 Media_Wearout_Indicator 0x0000   000   000   000    Old_age   오프라인      -       2531

234 알 수 없는_속성       0x0032   000   000   000    Old_age   항상       -       3465

241 Total_LBA_Written      0x0032   000   000   000    Old_age   항상       -       3465

242 Total_LBA_Read         0x0032   000   000   000    Old_age   항상       -      2030

SSD 是否健康的参数分析:

이때 서비스 수명은 더 이상 Intel SSD와 같은 Media_Wearout_Indicator 매개변수가 아닙니다(물론 OCZ에도 있고 Crucial에서는 Perc_Rated_Life_Used가 됩니다). 하지만 실제로는 주로 SSD가 건강한지 확인해야 합니다. Wear Leveling Count(입자 평균 삭제 쓰기 횟수) 및 Grown Failling Block Ct.

매개변수

다음 두 줄에 주의하세요.

170 Grown_Failing_Block_Ct 0x0033 100 100 000 사전 실패 항상 - - 0

173 Wear_Levelling_Count 0x0033 090 090 000 사전 실패 항상 - 536

위의 두 매개변수가 핵심입니다:

Wear Leveling Count: 먼저 이 매개변수에 대해 이야기해 보겠습니다. 더 중요한 것은 이 하드 드라이브가 1년 동안 사용된 SSD 하드 드라이브라는 점입니다. 이 128G 하드 드라이브의 P/E 수는 536개로 아직 90%의 수명이 있음을 나타냅니다. 따라서 이 하드 디스크에 사용된 플래시 메모리 입자의 수명은 약 5000배입니다. 5000이므로 이 항목의 값은 90(CA)입니다. Grown Failing Block Count(사용 중인 새 배드 블록 수): 이 항목은 SSD 플래시 메모리가 작동할 때 발생하는 배드 블록 수(HDD의 배드 섹터와 유사)를 나타냅니다. 파티클이 사용 중입니다. 즉, 아직 불량 블록이 없는 것입니다. 새로 구입한 SSD의 데이터가 정상적인 사용 중에 짧은 시간 내에 크게 변경되면 디스크에 문제가 있을 수 있다는 뜻입니다. 최대한 빨리 A/S에 문의하세요.

MegaCli의 일반적인 매개변수 조합 소개:

MegaCli -cfgdsply -aALL | grep "오류"                                                                                     ​  ​                               

MegaCli -cfgdsply -aALL | grep “메모리” 【메모리 크기】

​                                  ㅋㅋㅋ                                                       

MegaCli -PDList -aALL                                                                                                                                                                             

MegaCli -AdpBbuCmd -aAll                                                                                                                                           

MegaCli -FwTermLog -Dsply -aALL 【RAID 카드 로그 보기】

​> ㅋㅋㅋ                                                                ㅋㅋㅋ                                                                 

MegaCli -LDInfo -LALL -aAll [모든 논리 디스크 그룹 정보 표시]

​                                                               

MegaCli -AdpBbuCmd -GetBbuStatus -aALL |grep “충전기 상태” 【충전 상태 확인】

MegaCli -AdpBbuCmd -GetBbuStatus -aALL                                                                                 ~

MegaCli -AdpBbuCmd -GetBbuCapacityInfo -aALL 【BBU 용량 정보 표시】

MegaCli -AdpBbuCmd -GetBbuDesignInfo -aALL       【BBU 설계 매개변수 표시】

MegaCli -AdpBbuCmd -GetBbuProperties -aALL                                                                                                                                             

MegaCli -cfgdsply -aALL                                                                                                >

디스크 제거부터 디스크 삽입까지 테이프 상태 변화:

기기       |보통|손상|재구축|보통

가상 드라이브 |최적|성능 저하|성능 저하|최적

물리적 드라이브 |온라인|실패 –> 구성되지 않음|재구축|온라인

위 내용은 CentOS에서 SSD 상태 및 수명을 감지하는 방법에 대한 자세한 설명의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 jb51.net에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제