PowerFlex 4.X: 仮想IPの欠落によるOS変換の失敗
Summary: MDMクラスターの仮想IPがMDMデータIPよりも少ない場合、リソース グループ(RG)のOS変換が完了してDUが発生します。
Symptoms
- OS変換操作は、ストレージ専用(SO) RGの1つ以上のノードで実行され、プロセスは失敗します。
- ターゲット ノードがSLES OSに正常に変換されました。
- 変換操作後のMDMクラスターの構成モードが異なり、StateがDegradedと表示されます。
--query_cluster出力には、元々マネージャーMDMであったノードがタイ ブレーカーとして表示され、その逆の場合も同様です。 ロールがactor_roleMDM構成ファイルでの設定 -/opt/emc/scaleio/mdm/cfg/conf.txt.
Example:
OS前の変換
MDMクラスターには、5_node構成モードと通常(正常)状態があり、ノードxxx002は正常ステータスとマネージャーMDM(プライマリー)です。

OS変換後
MDMクラスターには、3_node構成モードと縮退(正常ではない)状態があり、ノードxxx002はエラー ステータスでマネージャーMDM(セカンダリー)です。

ノードxxx002の構成ファイルは、actor_role_is_manager=0(タイ ブレーカー)に設定されています。

問題
MDMクラスターは障害が発生し、予期しない状態です。DUの可能性があります。
Cause
OS変換中に、PFMPは使用可能なノード間でMDMロールを再バランシングします。PFMPは、MDMクラスターの仮想IPアドレスを、MDMクラスター ノードとスタンバイ マネージャー/タイ ブレーカーをインストールおよび追加するためのアンカーとして使用します。
ノードのOSがSLESに正常に変換されると、MDMクラスター ノードの再バランシング プロセスがトリガーされます。Virtual IP Addressesは、検索するIPが2つあることを示しており、ノードにはIPが4つあるため、検索が失敗し、インストールがデフォルトでスタンバイ タイ ブレーカーに設定されてインストールが続行されます。
Cluster:
Name: sio-1, ID: 0a1707234b50f20f, Mode: 5_node, State: Normal, Active: 5/5, Replicas: 3/3
...
Virtual IP Addresses: 10.122.160.100, 10.123.160.100 <<<<<
Primary MDM:
Name: sio-101, ID: 0x6bd7be1d61b4c900
IP Addresses: 10.122.160.101, 10.123.160.101, 10.122.224.101, 10.123.224.101, Port: 9011, Virtual IP interfaces: bond0.393, bond1.398 <<<<<
...
Secondary MDMs:
Name: sio-102, ID: 0x0b5a343e4caba901
IP Addresses: 10.122.160.102, 10.123.160.102, 10.122.224.102, 10.123.224.102, Port: 9011, Virtual IP interfaces: bond0.393, bond1.398 <<<<<
....
Name: sio-104, ID: 0x749bb9791864d903
IP Addresses: 10.122.160.104, 10.123.160.104, 10.122.224.104, 10.123.224.104, Port: 9011, Virtual IP interfaces: bond0.393, bond1.398 <<<<<
....
Tie-Breakers:
Name: sio-105, ID: 0x612f04b03a127004
IP Addresses: 10.122.160.105, 10.123.160.105, 10.122.224.105, 10.123.224.105, Port: 9011 <<<<<
...
Name: sio-103, ID: 0x154f223f2046a305
IP Addresses: 10.122.160.103, 10.123.160.103, 10.122.224.103, 10.123.224.103, Port: 9011 <<<<<
...
Standby MDMs:
Name: sio-106, ID: 0x6bd7be1d61b4c900, Manager
IP Addresses: 10.122.160.106, 10.123.160.106, 10.122.224.106, 10.123.224.106, Port: 9011, Virtual IP interfaces: bond0.393, bond1.398 <<<<<
...
Name: sio-107, ID: 0x612f04b03a127004, Tie-Breaker
IP Addresses: 10.122.160.107, 10.123.160.107, 10.122.224.107, 10.123.224.107, Port: 9011 <<<<<
Name: sio-108, ID: 0x0b5a343e4caba901, Manager
IP Addresses: 10.122.160.108, 10.123.160.108, 10.122.224.108, 10.123.224.108, Port: 9011, Virtual IP interfaces: bond0.393, bond1.398 <<<<<
...
Name: sio-112, ID: 0x612f04b03a127004, Tie-Breaker
IP Addresses: 10.122.160.112, 10.123.160.112, 10.122.224.112, 10.123.224.112, Port: 9011 <<<<<
その結果、インストール プロセスはデフォルトのMDMロールであるTie-Breakerに戻り、すべてのMDMがTie-Breakerとしてインストールされるため、MDMクラスターは破損します。
DEBUG [2025-11-23T06:51:03.699277] 316828: provider/elementmanager/scaleio.rb:5702:in `add_mdm': scaleio-block-legacy-gateway: Failed to add MDM sio-102 to VxOS cluster with error {"message"=>"Illegal number of IP addresses. The Primary MDM, the Secondary MDM, and the Tie-Breaker must each have the same number of IP addresses.", "httpStatusCode"=>500, "errorCode"=>298}. Retying 1
Resolution
前述のようにMDMクラスターが障害状態にある場合は、EEチームに連絡してクラスターのリカバリーに関するサポートを受けてください。
OS変換またはDUの失敗を回避するには、OS変換を試行する前に次のアクションを実行します。
仮想IPインターフェイスを増やして仮想IPアドレスを追加するか、MDMのデータIPを減らすことによって、MDMクラスター メンバーとスタンバイMDMは、クラスターの仮想IPアドレスと同じ数のIPアドレス(データIP)を持つ必要があります。
次のいずれかのオプションに従って問題を修正します。プライマリー/セカンダリー/タイブレーカー/スタンバイMDMのデータIP数に合わせてMDMクラスターの仮想IPを増やすか、MDMクラスターの仮想IP数に合わせてデータIPを減らします。
MDMクラスターの仮想IPを増やします。
- 対応するSDS IPロールと同じ順序でvirtual_ip_interfaceを追加してください。
- virtual_ip_interfaceは、必ず対応するcluster_virtual_ipと同じ順序で追加してください。
- 新しいcluster_virtual_ipをSDCに追加してください。
1)仮想IPをクラスターに追加し、仮想IPインターフェイスをプライマリーMDMおよびセカンダリーMDMに追加します。
A。既存の仮想IPをクリアします。
scli --modify_cluster_virtual_ips --clear_all
B。古い仮想IPと新しい仮想IPを追加します(コンマ区切りリスト、各コンマの後のスペースは省略)。
scli --modify_cluster_virtual_ips --cluster_virtual_ip <Virtual IP 1,Virtual IP 2,Virtual IP 3,Virtual IP 4>
c. 既存の仮想 IP インターフェイスをクリアします。
scli --modify_virtual_ip_interfaces --clear_all
2)SDCと、クラスターの仮想IPを使用するその他のクライアントを、新しいIPでアップデートします。
変更を有効にするには、サーバーの再起動が必要です。
- Linuxの場合:
/opt/emc/scaleio/sdc/bin/drv_cfg新しいIPアドレス リストはコンマ区切りリストであり、各コンマの後のスペースを省略する必要があります。既存のアドレスを保持する場合は、このリストに含めます。
drv_cfg --mod_mdm_ip --ip <One of the existing MDM IP addresses> <All MDM IP addresses>
- Windows:
C:\Program Files\emc\scaleio\sdc\bin\drv_cfg
新しいIPアドレス リストはコンマ区切りリストであり、各コンマの後のスペースを省略する必要があります。既存のアドレスを保持する場合は、このリストに含めます。
- ESXi:
- 実行中の構成を取得します。このコマンドは、現在設定されているすべてのESXi構成パラメーター、SDC GUID、MDM IPを表す文字列を返します。
cat /etc/vmware/esx.conf | grep scini | grep options
-
- 出力の詳細を使用してコマンドを実行し、新しい仮想IPを追加します(コンマ区切りリスト。各コンマの後のスペースは省略します)。
<XXX> - ユーザーが生成したGUID文字列です。GUIDは、プライマリーMDMでSCLIコマンド「--query_all_sdc」を使用して検証できます。 <LIST_VIP_MDM_IPS> は、すべてのMDM IPアドレスまたはMDMの仮想IPアドレスのコンマ区切りリストです。タイブレーカーIPアドレスはここに含めないでください。
- 出力の詳細を使用してコマンドを実行し、新しい仮想IPを追加します(コンマ区切りリスト。各コンマの後のスペースは省略します)。
- ESXiをメンテナンス モードにして再起動します。
3)PFMP UIを使用してRGを削除し、新旧のMDMクラスターのすべての仮想IPアドレスを使用して再度追加します。
4)OSの会話が正常に完了し、システムが正常な状態になった後、変更を元に戻すには、 手順1〜3を実行します。
MDM DATA IPの削減。
1)現在のクラスター モードに基づいて、MDMクラスターを3_nodeモードまたは1_nodeモードに縮小します。
2)クラスターのVIPの数に基づいて、MDM DATA IPの数を減らして、すべてのMDM(スタンバイ、TB、セカンダリー)を再度追加します。
問題が発生するバージョン
PFMPの4.x
修正バージョン
PFMPの5.1