PowerEdge:特定のエンタープライズ ハード ドライブでの読み取りおよび検証ECCエラーによる高いSMARTエラー率
Summary: 一部のエンタープライズ ハード ドライブでの高いSMARTエラー率は情報提供のみを目的としており、ハードウェアの正常性には関係ありません。
Symptoms
目次
概要
S.M.A.R.T.(Self-Monitoring, Analysis, and Reporting Technology、しばしばSMARTと表記される)は、国際的に標準化されたハード ドライブおよびSSD用の正常性監視システムです。
SMARTの主な機能は、ドライブの信頼性インジケーターを検出して報告し、障害を予測して、障害が発生する前にハードウェアを交換できるようにして、データの整合性を維持することです
Dellは、これらの価値の解釈において、ハード ドライブ ベンダーと協力しています。
説明
一部のエンタープライズ ハード ドライブのSMARTステータスを確認したところ、特定のモデルで読み取り率が高く、ECC訂正率が高いことを確認しました。これらの値を他のハード ドライブと比較すると、一部のモデルのエラー率が他のモデルよりも高く、ECCの訂正がゼロであることが示唆される場合があります
このエラー率は、数億のECC修正として表示される場合があり、より多くのI/Oトランザクションが発生すると、急速に増加する可能性があります。
このような状況の例を以下に示します。この例は、コマンド「smartctl -a /dev/sdX」を参照してください。
図1: エラー カウンター ログ
Smartctl アプリケーションは、次のコンポーネントです。 Smartmontoolsは、ハード ドライブの正常性を照会するためのオープンソースのツールセットです。
Smartmontoolsは、デバイスのECCエラーの数を正確に反映していない可能性があります。
Cause
Resolution
対処方法
SMART仕様によって、ベンダーはこれらの上記の例に示すようなカウンターを情報提供を目的として提供できます。カウンターは、必ずしもECCロジック内のソフトまたはハード フォールトの数ではありません。これにより、各ドライブ ベンダーは、使用可能なSMARTフィールドに表示される内容を柔軟に選択できます。一部のベンダーでは、ECCの読み取りまたは検証のカテゴリーにエラー データは含まれていません。上の例では、ベンダーがECC機能を監視するためにカウンターを使用することを選択しています。提示されている値は、エラー率を表していません。同様に、一部のディスクで他のディスクよりもイベントの発生率が高くても、パフォーマンスの問題が存在することを示すわけではありません。
エンタープライズ ハード ドライブ モデルの正常性カウンターに関する具体的な質問については、サポート技術者に問い合わせて、デル・テクノロジーズのエンジニアリング チームから回答を得てください。
の詳細を確認してください。
Additional Information
詳細情報
- SMARTバリューおよびその他のSCSIストレージ インターフェイスの国際標準化の詳細については、 こちら
にあるT10テクニカル委員会のホーム ページを参照してください。
Smartmontoolsは、最新のATA、シリアルATA、SCSI/SAS、およびNVMeハードドライブに組み込まれている自己監視、分析、およびレポート作成テクノロジーシステムを使用して、コンピュータストレージシステムを制御および監視するためのユーティリティです。これはDellのツールではありません。詳細情報Smartmontoolsこちらでご覧いただけます。