PowerFlex: Як виявити, чи має стійка пам'ять (NVDIMM) погані блоки
Summary: Пули зберігання дрібної гранулярності PowerFlex використовують постійну пам'ять (PMEM), також відому як енергонезалежна DIMM (NVDIMM), для прискорення та стиснення даних. Ці DIMM можуть мати несправні блоки, як і звичайні RDIMM, і їх потрібно періодично контролювати на наявність несправностей, як і будь-який інший тип диска. У попередньому релізі SDS-пристрій виявляє несправний блок лише після доступу до відповідного розділу і невдалого читання через невдалий SDS. Для попередньої версії наступні кроки можна виконати проактивно для виявлення NVDIMM з несправними блоками та їх заміни. Примітка: оскільки у продукті є вбудована надлишковість, дані цих блоків зберігаються на іншому вузлі, і у разі відмови SDS виходить з ладу, а інші SDS обслуговуватимуть IO. ...
Instructions
Ця процедура застосовна лише до операційних систем на базі Linux.
Примітка: Реалізація на основі ESXi на базі VMware зберігає можливість перевіряти наявність несправностей пристрою і не може бути запитана у PowerFlex Storage VM; у разі збою NVDIMM сховище даних NVRAM буде офлайн, а VM Storage вимкнеться і не зможе завантажитися, доки NVDIMM не буде замінено.
Як виявити несправні блоки на ОС Linux:
1. Виконайте таку команду, використовуючи оболонку кожного хоста, який має NVDIMM:
ПРИМІТКА: Рекомендація щодо частоти — один раз на день.
ndctl list --media-errors
Приклад командного виводу для DAX-пристрою, який має збої.
У наведеній нижче частині виводу простор імен 1.0 з dax 1.0 має 13 несправних блоків і повинен бути замінений.
[
{
"dev":"namespace1.0",
"mode":"devdax",
"map":"dev",
"size":62914560,
"uuid":"47072fee-1447-4e04-b4ca-f28e2c03af80",
"chardev":"dax1.0",
"align":4096,
"badblock_count":13,
"badblocks":
2. Кореляція пристрою DAX, який використовується в пулі зберігання PowerFlex:
a. Щоб отримати список усіх пристроїв зберігання, налаштованих для кожного пулу зберігання кластера, спочатку потрібно увійти:
scli --login --username <NAME> --password <PASSWORD>
b. Перегляньте список пристроїв, налаштованих для кожного пулу зберігання:
for SNAME in $(scli --query_all_sds | grep ID: | awk '{print $5}'); do echo $SNAME ; scli --query_sds --sds_name $SNAME | grep -E "Path|Pool" ; done
Вихідні дані, подібні до наступного, мають з'являтися для кожного SDS у кластері:
SDS_Node1 Storage Pool information (total of 2 Storage Pools): 1: Storage Pool: default inflight requests factor: 115, inflight bandwidth factor 115 2: Storage Pool: fg_1 inflight requests factor: 115, inflight bandwidth factor 115 1: Name: N/A Path: /dev/sdv Original-path: /dev/sdv ID: ddfeb59d00030000 Storage Pool: default, Capacity: 1786 GB, State: Normal 2: Name: N/A Path: /dev/sdk Original-path: /dev/sdk ID: ddfedc3100030005 Storage Pool: fg_1, Capacity: 894 GB, State: Normal 3: Name: N/A Path: /dev/sdl Original-path: /dev/sdl ID: ddfedc3200030006 Storage Pool: fg_1, Capacity: 894 GB, State: Normal 4: Name: N/A Path: /dev/sdm Original-path: /dev/sdm ID: ddfedc3300030007 Storage Pool: fg_1, Capacity: 894 GB, State: Normal 5: Name: N/A Path: /dev/sdn Original-path: /dev/sdn ID: ddfedc3400030008 Storage Pool: fg_1, Capacity: 894 GB, State: Normal 6: Name: N/A Path: /dev/svm_sdo Original-path: /dev/svm_sdo ID: ddfedc3500030009 Storage Pool: fg_1, Capacity: 894 GB, State: Normal 7: Name: N/A Path: /dev/svm_sdp Original-path: /dev/svm_sdp ID: ddfedc360003000a Storage Pool: fg_1, Capacity: 894 GB, State: Normal 1: Name: N/A Path: /dev/dax0.0 Original-path: /dev/dax0.0 ID: ddfedc2100030001 Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 1.3 GB (1372 MB), State: Normal 2: Name: N/A Path: /dev/dax1.0 Original-path: /dev/dax1.0 ID: ddfedc2200030002 Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 1.3 GB (1372 MB), State: Normal 3: Name: N/A Path: /dev/dax2.0 Original-path: /dev/dax2.0 ID: ddfedc2300030003 Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 686.0 MB (702464 KB), State: Normal 4: Name: N/A Path: /dev/dax3.0 Original-path: /dev/dax3.0 ID: ddfedc2400030004 Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 686.0 MB (702464 KB), State: Normal
Це означає, що цей вузол має DAX-пристрій /dev/dax1.0, який використовується пулом акселерації, ac_1 має несправні блоки і його потрібно замінити.
Підтримка PowerFlex
- Якщо такий випадок виявлено лише на одному хості, продовжуйте видалення DAX-пристрою з системи PowerFlex і відкрийте сервісний виклик до FRU (Field replacement unit) несправного пристрою PMEM\NVDIMM.
- Dell Technologies рекомендує якнайшвидше замінити пристрій PMEM\NVDIMM у період запланованого обслуговування.
- Процес заміни несправного NVDIMM описаний у R640\R740xd\R840 Field Replaceable Unit Guide, відповідний розділ: "Заміна NVDIMM у сервері VxFlex Ready Node R640\R740xd\R840 на базі Linux."
- Якщо у вас більше ніж один пристрій на різних вузлах в одному Fine Granularity Storage Pool з несправними блоками, відкрийте сервісний виклик до підтримки PowerFlex для перевірки стабільності даних.