PowerFlex 4.X: Помилка конверсії ОС через відсутність віртуальних IP
Summary: Конвертація ОС для Resource Group (RG) завершується і викликає DU, коли кластер MDM має менше віртуальних IP, ніж MDM DATA IP.
Symptoms
- Операція конвертації ОС виконується на одному або кількох вузлах у системі Storage Only (SO) RG, і процес зазнає невдачі.
- Цільовий вузол успішно конвертується в SLES OS.
- Кластер MDM має інший режим конфігурації після операції конвертації, і стан відображається як деградований.
--query_clusterвихід може показувати вузли, які спочатку були MDM менеджера, як Tie-Breaker і навпаки. Роль може не відповідатиactor_roleналаштування у файлі конфігурації MDM -/opt/emc/scaleio/mdm/cfg/conf.txt.
Приклад:
Конверсія до OS
Кластер MDM має 5_node режим конфігурації та нормальний (здоровий) стан, а вузол xxx002 знаходиться у нормальному статусі та менеджерському MDM (первинному):

Після переходу в OS
Кластер MDM має режим конфігурації 3_node та деградований (нездоровий) стан, а вузол xxx002 перебуває у статусі помилки та менеджерському MDM (вторинному):

Конфігураційний файл для вузла xxx002 встановлений у actor_role_is_manager=0, тобто Tie-Breaker:

Вплив
Кластер MDM перебуває у несправному і несподіваному стані — можливий DU.
Cause
Під час конвертації ОС PFMP ребалансує ролі MDM між доступними вузлами. PFMP використовує віртуальні IP-адреси кластера MDM як основу для встановлення та додавання вузлів кластера MDM та менеджера очікування/вирішувачів очікування.
Після успішного конвертування ОС вузла у SLES запускається процес ребалансування вузлів кластера MDM, і оскільки віртуальні IP-адреси вказують, що є 2 IP-адреси, які потрібно шукати, а вузли мають 4 IP, пошук завершується невдачею, і інсталяція продовжується, за замовчуванням встановлення на Standby Tie-Breaker.
Cluster:
Name: sio-1, ID: 0a1707234b50f20f, Mode: 5_node, State: Normal, Active: 5/5, Replicas: 3/3
...
Virtual IP Addresses: 10.122.160.100, 10.123.160.100 <<<<<
Primary MDM:
Name: sio-101, ID: 0x6bd7be1d61b4c900
IP Addresses: 10.122.160.101, 10.123.160.101, 10.122.224.101, 10.123.224.101, Port: 9011, Virtual IP interfaces: bond0.393, bond1.398 <<<<<
...
Secondary MDMs:
Name: sio-102, ID: 0x0b5a343e4caba901
IP Addresses: 10.122.160.102, 10.123.160.102, 10.122.224.102, 10.123.224.102, Port: 9011, Virtual IP interfaces: bond0.393, bond1.398 <<<<<
....
Name: sio-104, ID: 0x749bb9791864d903
IP Addresses: 10.122.160.104, 10.123.160.104, 10.122.224.104, 10.123.224.104, Port: 9011, Virtual IP interfaces: bond0.393, bond1.398 <<<<<
....
Tie-Breakers:
Name: sio-105, ID: 0x612f04b03a127004
IP Addresses: 10.122.160.105, 10.123.160.105, 10.122.224.105, 10.123.224.105, Port: 9011 <<<<<
...
Name: sio-103, ID: 0x154f223f2046a305
IP Addresses: 10.122.160.103, 10.123.160.103, 10.122.224.103, 10.123.224.103, Port: 9011 <<<<<
...
Standby MDMs:
Name: sio-106, ID: 0x6bd7be1d61b4c900, Manager
IP Addresses: 10.122.160.106, 10.123.160.106, 10.122.224.106, 10.123.224.106, Port: 9011, Virtual IP interfaces: bond0.393, bond1.398 <<<<<
...
Name: sio-107, ID: 0x612f04b03a127004, Tie-Breaker
IP Addresses: 10.122.160.107, 10.123.160.107, 10.122.224.107, 10.123.224.107, Port: 9011 <<<<<
Name: sio-108, ID: 0x0b5a343e4caba901, Manager
IP Addresses: 10.122.160.108, 10.123.160.108, 10.122.224.108, 10.123.224.108, Port: 9011, Virtual IP interfaces: bond0.393, bond1.398 <<<<<
...
Name: sio-112, ID: 0x612f04b03a127004, Tie-Breaker
IP Addresses: 10.122.160.112, 10.123.160.112, 10.122.224.112, 10.123.224.112, Port: 9011 <<<<<
Внаслідок цього процес встановлення повернеться до стандартної ролі MDM — Tie-Breaker, і всі MDM будуть встановлені як Tie-Breaker, що призводить до розриву кластера MDM:
DEBUG [2025-11-23T06:51:03.699277] 316828: provider/elementmanager/scaleio.rb:5702:in `add_mdm': scaleio-block-legacy-gateway: Failed to add MDM sio-102 to VxOS cluster with error {"message"=>"Illegal number of IP addresses. The Primary MDM, the Secondary MDM, and the Tie-Breaker must each have the same number of IP addresses.", "httpStatusCode"=>500, "errorCode"=>298}. Retying 1
Resolution
Якщо кластер MDM перебуває у несправному стані, як зазначено вище, звертайтеся до команди електротехніки для допомоги у відновленні кластера.
Щоб уникнути невдалої конверсії ОС або DU, виконайте наступні дії перед спробою конвертації ОС.
Члени кластера MDM та резервні MDM повинні мати таку ж кількість IP-адрес (DATA IP), як і віртуальні IP-адреси кластера, збільшуючи віртуальні IP-інтерфейси та додаючи віртуальні IP-адреси, або зменшуючи кількість DATA IP MDM.
Дотримуйтесь одного з наступних варіантів для усунення проблеми: або збільште кількість віртуальних IP кластера MDM, щоб відповідати кількості IP Primary/Secondary/Tie-Breaker/Standby, або зменшити кількість IP DATA до рівня віртуальної IP кластера MDM.
Збільшіть віртуальні IP кластера MDM.
- Обов'язково додайте virtual_ip_interfaceу тому ж порядку, що й відповідні ролі SDS IP.
- Обов'язково додавайте virtual_ip_interfaces у тому ж порядку, що й відповідні cluster_virtual_ips.
- Обов'язково додайте нові cluster_virtual_ipдо SDC/s.
1) Додати додаткові віртуальні IP до кластеру та віртуальні IP-інтерфейси до основних і вторинних MDM.
a. Очистіть існуючі віртуальні IP-адреси:
scli --modify_cluster_virtual_ips --clear_all
b. Додайте старі та нові віртуальні IP-адреси (список розділених комами, пробіл після кожної коми опущено):
scli --modify_cluster_virtual_ips --cluster_virtual_ip <Virtual IP 1,Virtual IP 2,Virtual IP 3,Virtual IP 4>
c. Очищення існуючих віртуальних IP-інтерфейсів:
scli --modify_virtual_ip_interfaces --clear_all
2) Оновити SDC/s та будь-який інший клієнт, який використовує віртуальні IP-адреси кластера, з новими IP-адресами:
Для впровадження змін потрібне перезапуск сервера.
- Linux:
/opt/emc/scaleio/sdc/bin/drv_cfgНовий список IP-адрес є списком, розділеним комами, і повинен пропускати пробіл після кожної коми. Якщо хочете зберегти існуючі адреси, додайте їх до цього списку.
drv_cfg --mod_mdm_ip --ip <One of the existing MDM IP addresses> <All MDM IP addresses>
- Вікна:
C:\Program Files\emc\scaleio\sdc\bin\drv_cfg
Новий список IP-адрес розділений комами і повинен пропускати пробіл після кожної коми. Якщо хочете зберегти існуючі адреси, додайте їх до цього списку.
- ESXi:
- Візьміть робочу конфігурацію. Команда поверне рядок, що представляє всі наразі встановлені параметри конфігурації ESXi, SDC GUID та MDM IP:
cat /etc/vmware/esx.conf | grep scini | grep options
-
- Використовуйте деталі з вихідних даних, щоб виконати команду додавання нових віртуальних IP (список, розділений комою, пробіл після кожної коми):
<XXX> — це рядок GUID, створений користувачем. GUID можна перевірити за допомогою команди SCLI '--query_all_sdc' на основному MDM. <LIST_VIP_MDM_IPS> — це список усіх IP-адрес MDM, розділений комою, або віртуальна IP-адреса MDM. Не вказуйте тут IP-адреси Tie-Breaker.
- Використовуйте деталі з вихідних даних, щоб виконати команду додавання нових віртуальних IP (список, розділений комою, пробіл після кожної коми):
- Введіть ESXi у режим обслуговування і перезавантажте.
3) Видалити RG, використовуючи інтерфейс PFMP, і знову додати всі віртуальні IP-адреси кластера MDM, старі та нові.
4) Після успішного завершення розмови з ОС і перебування системи у здоровому стані, щоб скасувати зміни, виконайте кроки 1-3.
Зменшуйте MDM DATA IP.
1) Зменшити кластер MDM до режиму 3_node або 1_node залежно від поточного режиму кластера.
2) Знову додати всі MDM (Standby, TB та Secondary) з меншою кількістю IP-адрес MDM DATA, залежно від кількості VIP кластера.
Впливові версії
PFMP 4.x
Виправлено у версії
PFMP 5.1
Additional Information
Пов'язані статті:
PowerFlex 4.X: Невдача конверсії ОС через неправильний порядок ролі SDS IP
PowerFlex 4.X: Помилка конверсії ОС через неналаштовану резервну MDM