ホームページ >システムチュートリアル >Linux >CentOS で SSD の健全性と寿命を検出する方法の詳細な説明

CentOS で SSD の健全性と寿命を検出する方法の詳細な説明

WBOY
WBOY転載
2024-01-08 13:18:201179ブラウズ

インターネット上では、ハードディスクの寿命データを確認できるのは Intel SSD だけです。Crucial と OCZ しか使用できない私たちのような貧乏人にとってはあまりにも不公平です。私と同じように、RAID を使用する方法は実際にはありません。他のベンダーの SSD の寿命を調べたことがありますか?

いくつか調べた結果、SSD を表示するすべてのコマンドは、RAID を介している限り、MegaCli と SmartCtl を使用して SSD ディスクの使用量を取得する必要があります。慎重に調べた結果、現在は

を使用しています。

RAID カードは、LSI Logic / Symbios Logic MegaRAID SAS 1078 および 2108 です。クエリには通常の MegaCli を使用します。

これはダウンロード アドレスです:

Centos 用 MegaCli5

Centos 用 MegaCli6

全体のプロセスは 2 つのステップに分かれており、最初のステップでは、RAID カードから次のハードディスクの情報を取得し、次に、smartCtl を使用してハードディスクの詳細情報を表示します。 MegaCli を使用して、RAID カードのハードドライブ情報を取得します。

次に、次のコマンドを使用します:

/opt/MegaRAID/MegaCli/MegaCli64 -PDList -aALL

これにより、RAID カードの内容が次のように表示されます:

エンクロージャデバイスID: 252

スロット番号: 7

デバイスID: 28

シーケンス番号: 2

メディア エラー数: 0

その他のエラー数: 1

予測失敗数: 0

最後の予測障害イベントのシーケンス番号: 0

PDタイプ:SATA

未加工サイズ: 119.242 GB [0xee7​​c2b0 セクター]

非強制サイズ: 118.742 GB [0xed7c2b0 セクター]

強制サイズ: 118.277 GB [0xec8e000 セクター]

ファームウェアの状態: オンライン、スピンアップ

SAS アドレス(0): 0x1e394d57aa996b80

接続ポート番号:7(path0)

お問い合わせデータ: 0000000011070303A99EC300-CTFDDAC128MAG 0007

FDE 対応可能: 対応不可

FDE 有効: 無効

セキュリティ保護: セキュリティなし

ロック済み: ロック解除済み

EKM の注意が必要: いいえ

外国: なし

デバイス速度: 6.0Gb/s

リンク速度: 1.5Gb/s

メディア タイプ: ソリッド ステート デバイス

上記の場所に注意してください。多くの情報が出力されます。メディア タイプ: ソリッド ステート デバイスのみが、これが SSD であることを示します。デバイス ID: 28 を書き留める必要があります。これは、後でクエリを使用するときに必要になります。上にハードドライブのモデルが表示されていることがわかります: お問い合わせデータ: 0000000011070303A99EC300-CTFDDAC128MAG 0007. この SSD が正常かどうかを示す標識もあります. ファームウェアの状態: オンライン、このオプションをスピンアップしているため、 SSD アラームを監視するには、このパラメータを直接監視するだけです。

smartctl を使用して SSD ハードドライブの詳細情報を取得する

メーカーやディスクの種類によって情報が異なりますのでご注意ください。Intel などのハードディスクの情報は紹介しません。以下は問い合わせに使用するコマンドです。このうち、-a はすべて表示します。情報。-d はハード ドライブを設定するために使用されます。このとき、異なる RAID カードによって使用されるインターフェイスが異なる可能性があるため、若干の違いがある可能性があることに注意する必要があります。

たとえば、Intel のハード ドライブの場合、 -d megaraid, 27 を使用するだけで問題なく動作します。しかし、上記の RAID カードを使用した後は、sat パラメータを指定する必要があり、次のようになります。

smartctl -a -d sat megaraid,27 /dev/sdb1 -s on

上記のSatはSCSIからATAに変換されたデバイスを指し、scsiやataなどのパラメータを追加できます。

この時点で、次の情報が表示されます:

モデル ファミリ: Crucial/Micron RealSSD C300/C400

デバイスモデル: C300-CTFDDAC128MAG

SMART 属性データ構造のリビジョン番号: 16

しきい値のあるベンダー固有の SMART 属性:

ID# ATTRIBUTE_NAME フラグ値、最悪のしきい値タイプ、RAW_VALUE が失敗した場合に更新されます

1 Raw_Read_Error_Rate 0x002f 100 100 000 常に事前失敗 - 0

5 Reallocated_Sector_Ct 0x0033 100 100 000 常に事前失敗 - 0

9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 5572

12 Power_Cycle_Count 0x0032 100 100 000 Old_age 常に - 3

170 Grown_Failing_Block_Ct 0x0033 100 100 000 事前失敗 常に - 0

171 Program_Fail_Count 0x0032 100 100 000 Old_age 常に - 0

172 Erase_Fail_Count 0x0032 100 100 000 Old_age 常に - 0

173 Wear_Levelling_Count 0x0033 090 090 000 事前失敗 常に - 536

174 Unexpect_Power_Loss_Ct 0x0032 100 100 000 Old_age 常に - 1

181 Non4k_Aligned_Access 0x0022 100 100 000 Old_age 常に - 0 0 0

183 SATA_Iface_Downshift 0x0032 100 100 000 Old_age 常に - 0

184 エンドツーエンド_エラー 0x0033 100 100 000 事前失敗 常に - 0

187 Reported_Uncorrect 0x0032 100 100 000 Old_age 常に - 0

188 Command_Timeout 0x0032 100 100 000 Old_age 常に - 0

189 Factory_Bad_Block_Ct 0x000e 100 100 000 Old_age 常に - 250

195 Hardware_ECC_Recovered 0x003a 100 100 000 Old_age 常に - 0

196 Reallocated_Event_Count 0x0032 100 100 000 Old_age 常に - 0

197 Current_Pending_Sector 0x0032 100 100 000 Old_age 常に - 0

198 オフライン_修正不可能 0x0030 100 100 000 Old_age オフライン - 0

199 UDMA_CRC_Error_Count 0x0036 100 100 000 Old_age 常に - 0

202 Perc_Rated_Life_used 0x0018 090 090 000 Old_age オフライン - 10

206 Write_Error_Rate 0x000e 100 100 000 Old_age 常に - 0

結果はOCZです:

デバイス モデル: OCZ-AGILITY3

シリアル番号: OCZ-1OX963Q8B5X2V684

SMART 属性データ構造のリビジョン番号: 10

しきい値のあるベンダー固有の SMART 属性:

ID# ATTRIBUTE_NAME フラグ 値最悪のしきい値タイプ 更新されました RAW_VALUE

1 Raw_Read_Error_Rate 0x000f 086 086 050 事前失敗 常に - 135388659

5 Reallocated_Sector_Ct 0x0033 100 100 003 事前失敗 常に - 9

9 電源投入時間 0x0032 100 100 000 Old_age 常に - 265772576277126

12 Power_Cycle_Count 0x0032 100 100 000 Old_age 常に - 15

171 不明な属性 0x0032 000 000 000 Old_age 常に - 9

172 不明な属性 0x0032 000 000 000 Old_age 常に - 0

174 不明な属性 0x0030 000 000 000 Old_age オフライン - 13

177 Wear_Leveling_Count 0x0000 000 000 000 Old_age オフライン - 1

181 Program_Fail_Cnt_Total 0x0032 000 000 000 Old_age 常に - 9

182 Erase_Fail_Count_Total 0x0032 000 000 000 Old_age 常に - 0

187 Reported_Uncorrect 0x0032 100 100 000 Old_age 常に - 0

194 温度_摂氏 0x0022 030 030 000 Old_age 常に - 30 (寿命の最小/最大 30/30)

195 Hardware_ECC_Recovered 0x001c 120 120 000 Old_age オフライン - 135388659

196 Reallocated_Event_Count 0x0033 100 100 003 事前失敗 常に - 9

201 Soft_Read_Error_Rate 0x001c 120 120 000 Old_age オフライン - 135388659

204 Soft_ECC_Correction 0x001c 120 120 000 Old_age オフライン - 135388659

230 Head_Amplitude 0x0013 100 100 000 事前失敗 常に - 100

231 温度_摂氏 0x0013 100 100 010 事前失敗 常に - 0

233 Media_Wearout_Indicator 0x0000 000 000 000 Old_age オフライン - 2531

234 Unknown_Attribute 0x0032 000 000 000 Old_age 常に - 3465

241 Total_LBA_Written 0x0032 000 000 000 Old_age 常に - 3465

242 Total_LBA_Read 0x0032 000 000 000 Old_age 常に - 2030

SSD が健康かどうかのパラメータ分析:

この時の耐用年数は、intel ssd のような Media_Wearout_Indicator パラメーターではなくなっていることに注意してください (もちろん OCZ にもあり、Crucial では Perc_Rated_Life_used になります)。しかし、実際には SSD が健全であるかどうかを確認する必要があります。主に、Wear Leveling Count (パーティクルの消去と書き込みの平均回数) このパラメータと、Grown Failing Block Ct.

パラメータによって決まります。

次の 2 行に注意してください:

170 Grown_Failing_Block_Ct 0x0033 100 100 000 事前失敗 常に - - 0

173 Wear_Levelling_Count 0x0033 090 090 000 常に事前失敗 - 536

上記の 2 つのパラメータが重要です:

ウェアレベリング数: 最初にこのパラメータについて説明しましょう。こちらの方が重要です。まず、このハード ドライブが 1 年間使用された SSD ハード ドライブであることを宣言しましょう。図に示されているデータは 536 です。この 128G ハード ドライブの数。ディスク全体の書き込み/消去 (P/E) 回数は 536 回で、まだ 90% の寿命があることを示しています。つまり、このハード ドライブで使用されているフラッシュ メモリ 粒子の寿命は約 5,000 回です536 は 5,000 の約 10% であるため、この項目の値は 90 (CA) になります Grown Failing Block Count (使用中の新しい不良ブロックの数): この項目は不良ブロック (HDD の不良セクターと同様) の数を表しますSSDフラッシュメモリ粒子使用時に発生するデータです ここのデータが0であれば不良ブロックが無いことを意味します 運が悪いと新しいSSDを購入して正常に使用するとこのデータは変化します

短期間で大幅に故障する場合は、ディスクに問題がある可能性がありますので、お早めにアフターサービスにご連絡ください。

MegaCli の一般的なパラメータの組み合わせの紹介:

MegaCli -cfgdsply -aALL | grep “エラー” [正常は 0]

megacli -ldgetprop -cache -lall -a0

MegaCli -cfgdsply -aALL | grep “メモリ” [メモリサイズ]

megacli -ldinfo -lall -aall

Megacli -Adpallinfo -aall

megacli -pdlist -aall

megacli -Adpbbucmd -aall

MegaCli -FwTermLog -Dsply -aALL 【RAID カードのログを表示】

Megacli -AdpCount

Megacli -AdpgetTime –Aall

Megacli -Adpallinfo -aall

MegaCli -LDInfo -LALL -aAll [すべての論理ディスクグループ情報を表示]

megacli -pdlist -aall

MegaCli -AdpBbuCmd -GetBbuStatus -aALL |grep “充電ステータス” [充電ステータスの表示]

megacli -Adpbbucmd -getbbustatus -aall

MegaCli -AdpBbuCmd -GetBbuCapacityInfo -aALL 【BBU容量情報の表示】

megacli -Adpbbucmd -getBbudesigninfo -aall

megacli -Adpbbucmd -getBbuproperties -aall

megacli -cfgdsply -aall

ディスクの取り外しからディスクの挿入までのテープ状態の変化:

デバイス |正常|損傷|再構築|正常

仮想ドライブ |最適|劣化|劣化|最適

物理ドライブ |オンライン|障害 –> 未構成|再構築|オンライン

以上がCentOS で SSD の健全性と寿命を検出する方法の詳細な説明の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事はjb51.netで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。