Maison >Tutoriel système >Linux >Explication détaillée de la façon de détecter la santé et la durée de vie des SSD sous CentOS

Explication détaillée de la façon de détecter la santé et la durée de vie des SSD sous CentOS

WBOY
WBOYavant
2024-01-08 13:18:201179parcourir

Sur tout Internet, il n'y a que des SSD Intel pour vérifier les données de durée de vie du disque dur. C'est tellement injuste pour les utilisateurs pauvres comme nous qui ne pouvons utiliser que Crucial et OCZ. Comme moi, je ne peux vraiment pas vérifier d'autres données via un RAID. Le SSD du commerçant a-t-il atteint la fin de sa durée de vie ?

Après quelques recherches, toutes les commandes pour afficher le SSD, tant qu'elles sont via RAID, nécessitent l'utilisation de MegaCli et smartCtl pour obtenir l'utilisation du disque SSD. Après des recherches minutieuses, j'utilise actuellement

.

Les cartes RAID sont des LSI Logic / Symbios Logic MegaRAID SAS 1078 et 2108. Utilisez le MegaCli habituel pour interroger :

Voici l'adresse de téléchargement :

MegaCli pour Centos5

MegaCli pour Centos6

L'ensemble du processus est divisé en deux étapes. La première étape consiste à obtenir les informations du disque dur ci-dessous à partir de la carte RAID. Ensuite, utilisez smartCtl pour afficher les informations détaillées du disque dur. Utilisez MegaCli pour obtenir les informations sur le disque dur sous la carte RAID :

Utilisez ensuite la commande suivante :

/opt/MegaRAID/MegaCli/MegaCli64 -PDList -aALL

De cette façon, vous pourrez connaître le contenu sous la carte RAID. Il sera affiché comme suit :

ID de l'appareil du boîtier : 252

Numéro d'emplacement : 7

ID de l'appareil : 28

Numéro de séquence : 2

Nombre d'erreurs média : 0

Autre nombre d'erreurs : 1

Nombre d'échecs prédictifs : 0

Numéro de séquence du dernier événement de défaillance prédictive : 0

Type de PD : SATA

Taille brute : 119,242 Go [secteurs 0xee7c2b0]

Taille non contrainte : 118,742 Go [secteurs 0xed7c2b0]

Taille contrainte : 118,277 Go [secteurs 0xec8e000]

État du micrologiciel : en ligne, lancé

Adresse SAS (0) : 0x1e394d57aa996b80

Numéro de port connecté : 7 (chemin 0)

Données de demande : 0000000011070303A99EC300-CTFDDAC128MAG         0007 

Capable FDE : non capable

FDE Activer : Désactiver

Sécurisé : non sécurisé

Verrouillé : Débloqué

A besoin de l'attention d'EKM : Non

État étranger : aucun

Vitesse de l'appareil : 6,0 Gb/s

Vitesse de liaison : 1,5 Gb/s

Type de média : périphérique à semi-conducteurs

Faites attention aux endroits ci-dessus. De nombreuses informations de ce type seront affichées. Seul le type de support : périphérique à semi-conducteurs signifie qu'il s'agit d'un identifiant de périphérique : 28. Cela sera nécessaire lors de l'interrogation ultérieure à l'aide de smartctl. . Nous pouvons voir que le modèle de disque dur est affiché ci-dessus : Données d'enquête : 0000000011070303A99EC300-CTFDDAC128MAG             0007. Il y a également un panneau vous indiquant si l'état du micrologiciel est normal : En ligne, activez cette option, donc si vous utilisez le SSD. surveillance et alarme, il suffit en gros de surveiller directement ce paramètre.

Utilisez smartctl pour obtenir des informations détaillées sur le disque dur SSD

Il convient de noter que les informations sur les différents types de disques de différents fabricants sont différentes. Les informations sur le disque dur d'Intel ne seront pas présentées. Voici la commande utilisée pour interroger Parmi eux, -a consiste à afficher toutes les informations. . -d est utilisé pour configurer le disque dur. Pour le moment, vous devez noter que les interfaces utilisées par les différentes cartes RAID peuvent être différentes, il peut donc y avoir de petites différences.

Par exemple, pour un disque dur Intel, utilisez simplement -d megaraid, 27 et cela fonctionnera bien. Mais après avoir utilisé la carte raid ci-dessus, je dois spécifier le paramètre sat, et cela devient comme ceci :

smartctl -a -d sat+megaraid,27 /dev/sdb1 -s on

Le sat ci-dessus fait référence au périphérique converti de SCSI en ATA. Vous pouvez ajouter des paramètres tels que scsi et ata.

À ce moment, les informations suivantes seront affichées :

Famille de modèles : Crucial/Micron RealSSD C300/C400

Modèle d'appareil : C300-CTFDDAC128MAG

Numéro de révision de la structure des données des attributs SMART : 16

Attributs SMART spécifiques au fournisseur avec seuils :

ID# ATTRIBUTE_NAME VALEUR DU DRAPEAU PIRE TYPE DE SEUIL MIS À JOUR WHEN_FAILED RAW_VALUE

1 Raw_Read_Error_Rate 0x002f 100 100 000 Pré-échec toujours - - 0

5 Reallocated_Sector_Ct 0x0033 100 100 000 Pré-échec toujours - - 0

9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 5572

12 Power_Cycle_Count 0x0032 100 100 000 Old_age Toujours - 3

170 Grown_Failing_Block_Ct  0x0033   100   100   000    Pré-échec  Toujours       -       0

171 Program_Fail_Count      0x0032   100   100   000    Old_age   Toujours       -       0

172 Erase_Fail_Count        0x0032   100   100   000    Old_age   Toujours       -       0

173 Wear_Levelling_Count    0x0033   090   090   000    Pré-échec  Toujours       -       536

174 Unexpect_Power_Loss_Ct  0x0032   100   100   000    Old_age   Toujours       -       1

181 Non4k_Aligned_Access    0x0022   100   100   000    Old_age   Toujours       -       0 0 0

183 SATA_Iface_Downshift    0x0032   100   100   000    Old_age   Toujours       -       0

184 End-to-End_Error        0x0033   100   100   000    Pré-échec  Toujours       -       0

187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Toujours       -       0

188 Command_Timeout         0x0032   100   100   000    Old_age   Toujours       -       0

189 Factory_Bad_Block_Ct    0x000e   100   100   000    Old_age   Toujours       -       250

195 Hardware_ECC_Recovered  0x003a   100   100   000    Old_age   Toujours       -       0

196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Toujours       -       0

197 Current_Pending_Sector  0x0032   100   100   000    Old_age   Toujours       -       0

198 Hors ligne_Uncorrectable   0x0030   100   100   000    Old_age   Hors ligne      -       0

199 UDMA_CRC_Error_Count    0x0036   100   100   000    Old_age   Toujours       -       0

202 Perc_Rated_Life_Used    0x0018   090   090   000    Old_age   Hors ligne      -       10

206 Write_Error_Rate        0x000e   100   100   000    Old_age   Toujours       -       0

如果是 OCZ的 :

Modèle d'appareil :     OCZ-AGILITY3

Numéro de série :    OCZ-1OX963Q8B5X2V684

Numéro de révision de la structure des données des attributs SMART : 10

Attributs SMART spécifiques au fournisseur avec seuils :

ID# ATTRIBUTE_NAME          DRAPEAU     VALEUR PIRE TYPE DE SEUIL      MISE À JOUR  WHEN_FAILED RAW_VALUE

1 Raw_Read_Error_Rate     0x000f   086   086   050    Pré-échec  Toujours       -       135388659

5 Reallocated_Sector_Ct   0x0033   100   100   003    Pré-échec  Toujours       -       9

9 Power_On_Hours          0x0032   100   100   000    Old_age   Toujours       -       265772576277126

12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Toujours       -       15

171 Unknown_Attribute       0x0032   000   000   000    Old_age   Toujours       -       9

172 Unknown_Attribute       0x0032   000   000   000    Old_age   Toujours       -       0

174 Unknown_Attribute       0x0030   000   000   000    Old_age   Hors ligne      -       13

177 Wear_Leveling_Count     0x0000   000   000   000    Old_age   Hors ligne      -       1

181 Program_Fail_Cnt_Total  0x0032   000   000   000    Old_age   Toujours       -       9

182 Erase_Fail_Count_Total  0x0032   000   000   000    Old_age   Toujours       -       0

187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Toujours       -       0

194 Température_Celsius     0x0022   030   030   000    Old_age   Toujours       -       30 (Durée de vie Min/Max 30/30)

195 Hardware_ECC_Recovered  0x001c   120   120   000    Old_age   Hors ligne      -       135388659

196 Reallocated_Event_Count 0x0033   100   100   003    Pré-échec  Toujours       -       9

201 Soft_Read_Error_Rate    0x001c   120   120   000    Old_age   Hors ligne      -       135388659

204 Soft_ECC_Correction     0x001c   120   120   000    Old_age   Hors ligne      -       135388659

230 Head_Amplitude          0x0013   100   100   000    Pré-échec  Toujours       -       100

231 Température_Celsius     0x0013   100   100   010    Pré-échec  Toujours       -       0

233 Media_Wearout_Indicator 0x0000   000   000   000    Old_age   Hors ligne      -       2531

234 Unknown_Attribute       0x0032   000   000   000    Old_age   Toujours       -       3465

241 Total_LBAs_Written      0x0032   000   000   000    Vieille_âge   Toujours       -       3465

242 Total_LBAs_Read         0x0032   000   000   000    Old_age   Toujours       -       2030

SSD 是否健康的参数分析:

Notez que la durée de vie à ce moment n'est plus le paramètre Media_Wearout_Indicator comme le SSD Intel (bien sûr, OCZ l'a aussi, et dans Crucial cela devient Perc_Rated_Life_Used Mais en fait, nous devons vérifier si le SSD est sain, principalement via). le Wear Leveling Count (nombre moyen d'écritures d'effacement des particules) et le paramètre Grown Failling Block Ct.

Faites attention aux deux lignes suivantes :

170 Grown_Failing_Block_Ct 0x0033 100 100 000 Pré-échec toujours - - 0

173 Wear_Levelling_Count 0x0033 090 090 000 Pré-échec toujours - 536

Les deux paramètres ci-dessus sont la clé :

Wear Leveling Count : parlons d'abord de ce paramètre. Il est plus important de préciser que ce disque dur est un disque dur SSD qui a été utilisé pendant un an. Les données affichées sur l'image sont 536, ce qui correspond à l'écriture complète. Le nombre de P/E de ce disque dur de 128 Go est de 536, ce qui montre qu'il y a encore 90 % de durée de vie. La durée de vie des particules de mémoire flash utilisées dans ce disque dur est donc d'environ 5 000 fois, soit environ 10 % de celle-ci. 5000, donc cet élément La valeur est 90 (CA). Nombre de blocs défectueux (nombre de nouveaux blocs défectueux utilisés) : cet élément représente le nombre de blocs défectueux (similaires aux secteurs défectueux du disque dur) qui apparaissent lorsque les particules de mémoire flash SSD sont en cours d'utilisation. Les données ici sont 0. C'est-à-dire qu'il n'y a pas encore de blocs défectueux. Si vous n'avez pas de chance lorsque vous achetez un nouveau SSD et que vous l'utilisez normalement, si les données changent de manière significative en peu de temps. cela signifie qu'il peut y avoir un problème avec le disque. Veuillez contacter le service après-vente au plus vite

.

Introduction aux combinaisons de paramètres courants de MegaCli :

MegaCli -cfgdsply -aALL | grep « Erreur »                                                                                                ​ 

MegaCli -LDGetProp -Cache -LALL -a0                                                                                                                     

MegaCli -cfgdsply -aALL | grep « Mémoire » 【Taille de la mémoire】

MegaCli -LDInfo -Lall -aALL                                                                                                                             

MegaCli -AdpAllInfo -aALL                                                                                                                                               

MegaCli -PDList -aALL  

MegaCli -AdpBbuCmd -aAll                                                                                                                                    

MegaCli -FwTermLog -Dsply -aALL 【Afficher le journal de la carte RAID】

"                                                                                           

MegaCli -AdpGetTime –aALL                                                                                                                                                           "                                                 

MegaCli -LDInfo -LALL -aAll [Afficher toutes les informations sur le groupe de disques logiques]

MegaCli -PDList -aAll                                                                                                                                                          

MegaCli -AdpBbuCmd -GetBbuStatus -aALL |grep « Statut du chargeur » 【Vérifier l'état de charge】

MegaCli -AdpBbuCmd -GetBbuStatus -aALL                                                                                                                                                                                 

MegaCli -AdpBbuCmd -GetBbuCapacityInfo -aALL 【Afficher les informations sur la capacité BBU】

MegaCli -AdpBbuCmd -GetBbuDesignInfo -aALL       【Afficher les paramètres de conception BBU】

"                                         

MegaCli -cfgdsply -aALL                                                                                                                                                                                                 

Le changement d'état de la bande, du processus de retrait du disque à l'insertion du disque :

Appareil       |Normal|Dommages|Reconstruire|Normal

Lecteur virtuel |Optimal|Dégradé|Dégradé|Optimal

Lecteur physique |En ligne|Échec –> Non configuré|Reconstruire|En ligne

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer