PowerFlex: SDS aygıtı, aygıt hala kullanımda ve iyi durumda olmasına rağmen hata bildiriyor
Summary: MDM, bir SDS'den aygıt hatalarını bildirir, ancak söz konusu SDS veya DAX aygıtı küme tarafından kullanılıyor ve iyi durumda.
Symptoms
MDM, S.M.A.R.T. özniteliklerine göre SDS veya DAX aygıtları hatası bildiriyor. Bir G/Ç sorunu oluşana kadar sürücü çıkarılmaz.
MDM events.txt
SDS cihazı örneği:
2018-06-18 14:16:10.290 SDS_DEV_MOVED_TO_FAILURE_STATE ERROR Device failure state reported on SDS: SIO-NODE3, Device: /dev/sdu
DAX cihazı örneği:
2021-06-06 21:11:25.765 SDS_DEV_MOVED_TO_FAILURE_STATE ERROR A device failure state exists on SDS: SIO-NODE3, Device: /dev/dax1.0. 2021-06-06 21:11:25.784 SDS_DEV_MOVED_TO_FAILURE_STATE ERROR A device failure state exists on SDS: SIO-NODE3, Device: /dev/dax0.0. 2021-06-06 21:11:25.786 SDS_DEV_MOVED_TO_FAILURE_STATE ERROR A device failure state exists on SDS: SIO-NODE3, Device: /dev/dax3.0. 2021-06-06 21:11:25.786 SDS_DEV_MOVED_TO_FAILURE_STATE ERROR A device failure state exists on SDS: SIO-NODE3, Device: /dev/dax2.0.
SDS, bir G/Ç sorunuyla karşılaştığında sürücüyü çıkarır. Aşağıda benzer bir hata görebilirsiniz:
2018-06-19 01:28:38.662 SDS_DEV_ERROR_REPORT ERROR Device error reported on SDS: SIO-NODE3, Device: /dev/sdb. 2018-06-19 01:28:38.962 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state.
Hata mesajlarındaki farka dikkat edin:
- SDS_DEV_MOVED_TO_FAILURE_STATE <<<--- device not failed - SDS_DEV_ERROR_REPORT <<<--- device failed
Sistemin söz konusu aygıta G/Ç atma/hata verdiğini ve DATA_DEGRADED durumuna geçerek yeniden oluşturmaya neden olduğunu unutmayın.
Ana bilgisayarın donanım tanılamalarının iDRAC'tan kontrol edilmesi, diskte aşağıdaki gibi öngörü hatalarının olduğunu gösterir:
Bu etki, kozmetikten (MDM olaylarının doldurulması) yeniden oluşturmaya neden olan bir sürücü arızasına kadar değişebilir.
Cause
SDS düğümündeki LIA aracısı, SDS tarafından kullanılan depolama aygıtlarının S.M.A.R.T. özniteliklerini örnekler. Bu verileri MDM'ye iletir ve MDM de görülen sorunları bildirir ancak verilere göre işlem yapmaz.
S.M.A.R.T. durumu yalnızca iki değer sağladığı için herhangi bir işlem yapılmaz: "eşik aşılmadı" ve "eşik aşıldı". Bunlar genellikle sırasıyla "sürücü tamam" veya "sürücü arızası" olarak temsil edilir.
Eşik aşıldı" değeri, sürücünün gelecekte arızalanma olasılığının yüksek olduğunu, yani sürücünün arızalanmak üzere olduğunu gösterir. Belirli sektörlere yazamama veya üreticinin iddia ettiğinden daha yavaş performans gibi yıkıcı veya ince olabilir.
Resolution
Söz konusu SDS veya DAX aygıtının değiştirilmesi gerekip gerekmediğini belirlemek için manuel donanım tanılaması çalıştırın. Gerekirse donanım satıcısına danışın.
Etkilenen sürümler
ScaleIO 2.x.x
VxFlex OS 3.0.x
PowerFlex 3.5.x
PowerFlex 3.6.0.x-3.6.1.x
Düzeltildiği sürüm
LIA örnekleme tasarımı PowerFlex 3.6.0.3'te geliştirilmiştir.
Yanlış pozitif MDM olayları PowerFlex 3.6.2'de düzeltildi.