Диск може потребувати заміни через помилки введення-виведення або якщо програмно-визначене сховище позначає диск як несправний або непридатний для використання

Summary: Користувачі можуть подати запит на заміну диска через помилки вводу/виводу або якщо диск позначено як «несправний» або «непридатний для використання» рішенням Software-Defined-Storage (SDS). ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

Існує кілька різних SDS-рішень, таких як Ceph (Linux), vSAN (VMware), Nutanix і так далі. Кілька однаково налаштованих серверів об'єднуються в мережу, щоб створити кластер зберігання. Сервери налаштовано за допомогою адаптера шини хоста (HBA) замість PERC, тому диски відображаються в операційній системі «як є». Операційна система керує всіма дисками на кожному сервері безпосередньо без будь-якого втручання з боку HBA. Накопичувач вказаний як «Справний» в інструментах моніторингу Dell (таких як iDRAC і OMSA) і ePSA Offline Diagnostics. Дані SMARTCTL для накопичувача можуть мати або не мати невиправлених помилок читання та запису. Тести SMART (короткі, довгі та розширені) проходять, і накопичувач відображається як «Справний».

 

Програмно-визначені рішення для зберігання даних (SDS) переносять усі елементи керування, пов'язані зі сховищем, з апаратного на програмне забезпечення за допомогою адаптера хост-шини (HBA) для забезпечення фізичного підключення до накопичувачів.

 

RAID-контролер (PERC) відповідає за виконання кількох проактивних дій з обслуговування дисків, включаючи патрулювання, читання та перевірку узгодженості на віртуальних дисках. Оскільки рішення SDS використовують адаптер хост-шини (HBA) замість PERC, програмне забезпечення тепер виконує всі ці дії з профілактичного обслуговування.

 

Користувачі можуть повідомляти про те, що SDS позначає диск як «несправний або непридатний для використання» або може містити список помилок введення-виведення на диску. Інструменти Dell Monitoring, такі як iDRAC і OMSA, повідомляють, що накопичувач справний і працює.

 

Такі інструменти, як «SMARTMON» або «SMARTCTL», можуть відображати деякі помилки на одному або кількох зазначених дисках, але загальний стан диска відображається як «ЗДОРОВИЙ або ОК».

 

 

Така розбіжність обумовлена наступними факторами:

  • iDRAC показує стан здоров'я компонента. Якщо прошивка накопичувача повідомляє, що він справний, iDRAC відображає те саме. Якщо на прошивці накопичувача зазначено, що він перебуває в стані прогнозованого збою, iDRAC відображає те саме.
  • Всі накопичувачі можуть витримувати деякі пошкоджені блоки або помилки, які неможливо виправити, і продовжувати працювати без будь-яких функціональних наслідків. Поріг пошкоджених блоків запрограмований виробником накопичувача в прошивці накопичувача і не є стандартним числом або відсотком.
  • Диски залишаються робочими, доки загальна кількість пошкоджених блоків або помилок, які неможливо виправити, на диску не перевищить прогнозований поріг відмови або відмови.
  • Зміщена адреса на диску позначається як пошкоджений блок, і дані переміщуються ТІЛЬКИ в тому випадку, якщо операція WRITE зазнає невдачі за цією конкретною адресою. Прошивка накопичувача не вважає помилки READ для маркування секторів пошкодженими блоками.
  • Помилки введення-виведення, зареєстровані на рівні операційної системи, можуть не відображатися в журналах життєвого циклу.

 

У такому випадку приводи функціонують і знаходяться в межах своїх робочих параметрів. Вони не відповідають вимогам і не вимагають заміни обладнання. Рекомендований план дій тут полягає у виконанні необхідних заходів з технічного обслуговування на програмному рівні для вирішення проблеми.

 

У такому випадку зберіть повний пакет журналів операційної системи або звіти з одного або кількох уражених серверів. Зверніться до Dell SST (якщо це передбачено гарантійною угодою) або постачальника операційної системи для перевірки журналу, оскільки вони повинні повідомити про подальші кроки щодо виправлення.

 

Dell SST або постачальник операційної системи визначає такі деталі:

  • Загальна кількість помилок введення-виведення, записаних ядром операційної системи (якщо такі є).
  • На яких пристроях (на одному або декількох) реєструються помилки.
  • Вид корупції: Рівень файлу або метаданих (за наявності)
  • Служба зберігання даних вийшла з ладу? Якщо так, то чому?
  • Коригувальні дії доступні в SDS для усунення таких помилок.

 

ПРИМІТКА: Пункти, згадані вище для Dell SST або постачальника операційних систем, не є всеосяжним списком. У їхньому дослідженні може бути кілька інших посилань або точок даних.

 

Affected Products

Rack Servers
Article Properties
Article Number: 000219050
Article Type: How To
Last Modified: 17 Jun 2025
Version:  4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.