Домен даних: Нумерація корпусів сховищ не є послідовною

Summary: У цій статті описано сценарії, коли номери полиць, призначені зовнішнім корпусам для зберігання даних (ES-30 і DS-60) на приладах домену даних, можуть бути непослідовними. Непослідовна нумерація або прогалини в послідовності нумерації полиць можуть виникнути після завершення операції міграції сховища, заміни шасі одного з корпусів зберігання або фізичного переміщення корпусу на новий шлях. Домен даних рекомендує застосувати кроки, описані в цій статті, щоб послідовно перенумерувати всі корпуси. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Майбутні вдосконалення коду операційної системи домену даних будуть зроблені для пом'якшення надмірного повторного сканування та операцій виявлення, коли нумерація полиць непослідовна. Поки такі зміни не будуть внесені, рекомендується застосувати необхідні кроки для забезпечення того, щоб номер полиці був послідовним після фізичної зміни або зміни серійного номера, що спричиняє прогалину в послідовній нумерації полиць.


Починаючи з DDOS 5.7.1, нумерація полиць прив'язана до серійного номера полиці сховища. Ми називаємо це полицею "persistent-id".
Корпус сховища може бути позначений як "Автономний" за кількома різними сценаріями, коли фізичні зміни були внесені до топології SAS.
У цьому прикладі нещодавно було завершено «міграцію сховища», а вихідні корпуси сховищ було фізично видалено. Оскільки кожна шафа для зберігання має призначений "persistent-id", тепер є кілька "офлайн" полиць (2,3,4,8), які більше не прикріплюються, Ці "офлайн-полиці більше не потрібні, щоб файлова система була цілою та працездатною. Той факт, що існують фантомні полиці або непослідовна нумерація приєднаних корпусів сховищ, не впливає на загальну роботу файлової системи домену даних, однак може викликати надмірне повторне сканування та операції виявлення під час завантаження, а також ядра SNMP при запиті до фантомного корпусу. Це призводить до довшого, ніж очікувалося, часу завантаження, а том стає недоступним одразу після завершення фази завантаження.

Використовуйте команду #enclosure show summary, щоб перерахувати всі корпуси, яким коли-небудь було видано персистен-id, разом із поточним станом корпусу.

#Enclosure Show Summary


----------------------
Enclosure   Model No.   Serial No.       State     OEM Name   OEM Value   Capacity
---------   ---------   --------------   -------   --------   ---------   --------
1           DD9800      NVT10164000024   Online                           4 Slots
2           DS60        APM00164936021   Offline                          60 Slots
3           DS60        APM00164802045   Offline                          60 Slots
4           DS60        APM00164802044   Offline                          60 Slots
5           DS60        APM00164902721   Online                           60 Slots
6           DS60        APM00164936019   Online                           60 Slots
7           DS60        APM00164936020   Online                           60 Slots
8           ES30        APM00164964966   Offline                          15 Slots
9           DS60        APM00164902719   Online                           60 Slots
10          DS60        APM00164902720   Online                           60 Slots
11          DS60        APM00164902722   Online                           60 Slots
12          ES30        APM00164964967   Online                           15 Slots
---------   ---------   --------------   -------   --------   ---------   --------
 
 
Використовуйте команду #enclosure show topology CLI, щоб перелічити, які корпуси для зберігання зараз підключені.
Дивлячись на топологію SAS, можна підтвердити, що "офлайн" полиці (2,3,4,8) насправді не прикріплені, і що числовий номер, присвоєний прикріпленим полицям, не є послідовним.

#Enclosure Show Topology
-----------------------
Port       enc.ctrl.port       enc.ctrl.port
----   -   -------------   -   -------------
2a     >    9.B.H: 9.B.E   >   10.B.H:10.B.E
2b     >    5.B.H: 5.B.E   >   11.B.H:11.B.E
2c     >    7.B.H: 7.B.E
2d     >   12.B.H:12.B.E
3a     >   10.A.H:10.A.E   >    9.A.H: 9.A.E
3b     >    6.B.H: 6.B.E
3c     >    7.A.H: 7.A.E
3d     >   12.A.H:12.A.E
6a     >   11.A.H:11.A.E   >    5.A.H: 5.A.E
6b     >    6.A.H: 6.A.
6d
----   -   -------------   -   -------------
Encl   WWN                Serial #
----   ----------------   --------------
5      N/A                APM00164902721
6      N/A                APM00164936019
7      N/A                APM00164936020
9      N/A                APM00164902719
10     N/A                APM00164902720
11     N/A                APM00164902722
12     N/A                APM00164964967
----   ----------------   --------------

 
Примітка: Різні виходи в графічному інтерфейсі або автопідтримці можуть показувати полицю "Офлайн" як відсутню

8.1 (відсутній)
 8.2 (відсутній)
 8.3 (відсутній)
 8.4 (відсутній)
 8.5 (відсутній)
 8.6 (відсутній)
 8.7 (відсутній)
 8.8 (відсутній)
 8.9 (відсутній)
 8.10 (відсутній)
 8.11 (відсутній)
 8.12 (відсутній)
 8.13 (відсутній)
 8.14 (відсутній)
 8.15 (відсутній)

Запити SNMP до фантомних корпусів призводять до помилок і наступних ядер. Відповідні повідомлення будуть розміщені в журналі messages.engineering

 # snmpwalk -v2c -c Public localhost -t 5 -r 5 dataDomainMib
Timeout: No Response from localhost
Apr 20 01:01:54 xx snmpd: WARNING: ddr/sm/snmp/enclosurePack_access.c:161      **** Enclosure id 3 is offline.
Apr 20 01:01:54 xx ddr_procmon: NOTICE: MSG-PMON-00008: Failure on /usr/sbin/snmpd.
Apr 20 01:01:54 xx ddr_procmon: WARNING: MSG-PMON-00011: Restarting /usr/sbin/snmpd.
Apr 20 01:01:56 xx ddfs[11215]: NOTICE: ddr_key_del_temp: deleting key-v2-100
Apr 20 01:02:04 xx snmpd: WARNING: ddr/sm/snmp/enclosurePack_access.c:161      **** Enclosure id 3 is offline.
Apr 20 01:02:04 xx ddr_procmon: NOTICE: MSG-PMON-00008: Failure on /usr/sbin/snmpd.
Apr 20 01:02:04 xx ddr_procmon: WARNING: MSG-PMON-00011: Restarting /usr/sbin/snmpd.
Apr 20 01:02:14 xx snmpd: WARNING: ddr/sm/snmp/enclosurePack_access.c:161      **** Enclosure id 3 is offline.
Apr 20 01:02:14 xx ddr_procmon: NOTICE: MSG-PMON-00008: Failure on /usr/sbin/snmpd.


Apr 20 14:02:42 xx snmpd: WARNING: dd_netsnmp_set_request_error: snmp error 129 occured
 
 

Cause

Сценарії, які можуть викликати цю умову, такі:
  • Фізичне переміщення корпусів для зберігання з одного пристрою домену даних на інший пристрій домену даних
  • Заміна шасі на будь-якому корпусі зберігання, що використовується (нове шасі введе новий серійний номер)
  • Storage Migration - після завершення міграції вихідні полиці більше не потрібні FS, і будуть фізично видалені.
  • #storage видалити команду CLI було проблемою.

Resolution

Щоб змусити полицю "persistent-id" перенумерувати в послідовному порядку, використовуйте наступні команди в режимі SE. 
           
SE# enclosure show persistent-id   
На виході буде деталізована інформація з корпусів, які прикріплені, і полиць, які більше не прикріплені, разом з відповідним постійним ідентифікатором. ви побачите, що є серійні номери, які більше не прикріплені або були видалені з топології SAS. Ті, які я виділив, більше не додаються, і #enclosure резюме шоу перерахує їх як "Офлайн".

Serial No. Model No. Persistent ID
-------------- --------- -------------
APM00164936021  DS60 2      <<< Offline
APM00164802045  DS60 3      <<< Offline
APM00164802044  DS60 4      <<< Offline
APM00164902721  DS60 5      
APM00164936019  DS60 6      
APM00164936020  DS60 7      
APM00164964966  ES30 8      <<< Offline
APM00164902719  DS60 9      
APM00164902720  DS60 10     
APM00164902722  DS60 11     
APM00164964967  ES30 12   
-------------- --------- -------------
12 enclosure(s) persisted.
 
Використовуйте командний рядок #enclosure release persistent-id , щоб звільнити наявні ідентифікатори персистентних ідентифікаторів.  Можна випустити лише ті, які перебувають в автономному режимі, або вибрати випуск  із них.  Під час наступного завантаження кожній прикріпленій полиці буде видано новий persistent-id, і не буде прогалин у нумерації полиць.

ПРИМІТКА: У HA Systems рекомендується запускати " enclosure release persistent-id all" на обох вузлах, по одному, починаючи з активного вузла перед перезавантаженням системи. Перезавантаження активного вузла призведе до відмови резервного вузла. Після того, як цикл перезавантаження HA буде завершено, і система знову стане доступною, перезавантажте поточний активний вузол, щоб завершити процес. 


SE# enclosure release persistent-id
              {||all}
    
 
Example:                                            
 #enclosure release persistent-id APMxxxxxxxxxxxxxx
 #enclosure release persistent-id 12
 #enclosure release persistent-id all

Далі перезавантажте систему, щоб дозволити видавати нові постійні ідентифікатори кожному корпусу сховища.

#system reboot

Після перезавантаження системи переконайтеся, що нумерація полиць послідовна і немає корпусів для зберігання, зазначених як "Офлайн".

# enclosure show summary
Enclosure   Model No.   Serial No.       State    OEM Name   OEM Value   Capacity
---------   ---------   --------------   ------   --------   ---------   --------
1           DD9800      NVT10162700023   Online                          4 Slots 
2           DS60        APM00164802045   Online              0           60 Slots
3           DS60        APM00164802043   Online              0           60 Slots
4           DS60        APM00164802044   Online              0           60 Slots
5           DS60        APM00164851510   Online              0           60 Slots
6           DS60        APM00164936021   Online              0           60 Slots
7           DS60        APM00164802046   Online              0           60 Slots
8           ES30        APM00164964966   Online                          15 Slots
---------   ---------   --------------   ------   --------   ---------   --------
8 enclosures present. 

 
SE# enclosure show persistent-id
Serial No.       Model No.   Persistent ID
--------------   ---------   -------------
APM00164802045   DS60        2            
APM00164802043   DS60        3            
APM00164802044   DS60        4            
APM00164851510   DS60        5            
APM00164936021   DS60        6            
APM00164802046   DS60        7            
APM00164964966   ES30        8            
--------------   ---------   -------------
7 enclosure(s) persisted.
 

Affected Products

Data Domain

Products

Data Domain, DD OS, DD OS Licensed Features
Article Properties
Article Number: 000054913
Article Type: Solution
Last Modified: 19 Jul 2023
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.