PowerScale:Isilon:Isilon 叢集上分析:網路集區 - 平行升級支援

摘要: 本知識文章提供有關 IOCA 檢查的更多詳細資料以及平行升級的一般概觀。

本文章適用於 本文章不適用於 本文無關於任何特定產品。 本文未識別所有產品版本。

症狀

Isilon 叢集上分析的報告輸出類似於以下內容:
 
Network Pools - Parallel Upgrade Support          FAIL

CRITICAL: A parallel upgrade runs the risk of making one or more external networks temporarily unavailable. Affected pools: groupnet0.subnet0.pool1, groupnet0.subnet1.pool1, groupnet0.subnet1.pool2

原因

  • 這是設計的運作方式,因為叢集有分離式外部網路,因此受影響網路集區中的所有節點都有可能同時重新開機。
  • 在這種情況下,用戶端無法透過與該網路集區相關聯的 SmartConnect Zone Name (SCZN) 存取叢集。 

解析度

在執行解決方案之前,請先瞭解平行升級的運作方式。

重要定義:
 

  • 磁碟集區:  分佈在群集節點子集之間的磁碟集合。 
  • 保護等級/原則:在 /ifs 檔案系統上的所有檔案都會指派一個保護等級。OneFS 會等量分配或鏡射單一磁碟集區節點和磁碟機的檔案內容。具有 2d+1n 保護等級的檔案可保證如果包含的磁碟集區中任兩個磁碟機或一個節點故障,該檔案仍可使用。
  • 鄰近地區:  完全包含一或多個磁碟集區的節點集。指派給磁碟集區的節點子集可能會與指派給另一個鄰近地區的節點子集重疊。鄰近地區之間的磁碟集區沒有重疊。 
  • 磁碟集區 DB API 和保留磁碟集區資料庫 API 具有保留功能,可讓用戶端應用程式 (例如升級架構) 從叢集移除一組節點 (即重新開機) 或磁碟機,而不會違反任何磁碟集區的保護。
  • 分離式外部網路:如果有一組節點的外部介面不會在所有磁碟集區上重疊,則叢集具有分離式外部網路

平行升級 -- 頂層概觀:
  • 平行升級會在所有節點上安裝新的作業系統,然後同時將節點子集重新開機,每個磁碟集區最多一個節點。
  • 每個節點都會嘗試保留其重新開機回合,直到所有節點升級為止。  節點子集和保留是以磁碟集區和節點可用性為依據。
  • 在平行升級期間,未重新開機的節點子集仍保持在線上狀態,並可繼續為用戶端提供服務。

檢查定義:
  • 叢集有分離式外部網路 (KB 範例:groupnet0.subnet0.pool1、groupnet0.subnet1.pool1、groupnet0.subnet1.pool2)
  • 在平行升級期間,這些網路集區可能會有 DU 風險,因為受影響網路集區中的所有節點可能同時重新開機 (亦即,它們都可能全都採取磁碟集區保留以同時重新開機)。 
  • 如果發生這種情況,將無法存取受影響網路集區的 SCZN。 

解決方案相關注意事項:
  • 由於每個叢集有不同的網路組態,因此所有叢集的解決方案都不一樣。
  • 為避免在平行升級期間在分離式網路集區上發生 DU,叢集和外部環境需要變更網路組態,這通常需要在用戶端進行數次核准。
  • 本 KB 文章不包含由於上述各點而導致 IOCA 檢查失敗的直接解決方案。
  • 但是,一般準則是受影響網路集區中至少有兩個節點的外部成員介面存在於同一鄰近地區/故障網域,以避免該 SmartConnect 網路集區面臨脫節網路/DU 風險 (亦即,將相同鄰近地區/故障網域的節點新增至受影響的網路集區)。 
  • 本 KB 文章提供命令說明如何判斷叢集的鄰近地區/故障網域,以及受影響網路集區中的成員節點。

解決方案: 
  • 使用以下命令判斷受影響網路集區中的成員節點 (注意:取代「<網路集區 1 ID> | <網路池 2 ID> | <network-pool 3 ID>」與來自 IOCA 的受影響網路集區 ID 檢查詳細資料,並使用「|」字元分隔。 
# isi network pools list -v | egrep -i 'ID: |ifaces' | egrep -A1 '<network-pool 1 ID> | <network-pool 2 ID> | <network-pool 3 ID>'
  • 執行以下命令以確定集群的鄰近地區 (注意裝回<IOCA 指令檔位置> 和<新的 OneFS 版本> 及其正確值) 
# perl <IOCA script location> -o <New OneFS version>,parallel  -e -r "checkNetworkParallelUpgrade"  
  • 交叉參照上述命令的輸出,以判斷需要對叢集的網路集區進行哪些變更。
  • 快速修正方法是將所有叢集節點新增至受影響的網路集區,但這通常不容易執行,因為外部網路環境可能不允許此變更。
  • 套用所需的變更後,再次重新執行 IOCA 檢查。
  • 如果無法判斷需要的變更,請向支援部門開啟案例以尋求進一步協助。
  • 以下範例可判斷測試案例中所需的變更:
1) Determine member nodes in affected network pools:
# isi network pools list -v | grep -i 'ID: |ifaces' | egrep -A1 'groupnet0.subnet0.pool1| groupnet0.subnet1.pool1| groupnet0.subnet1.pool2'
                     ID: groupnet0.subnet0.pool1
                 Ifaces: 1:10gige-agg-1, 2:10gige-agg-1, 4:10gige-agg-1, 3:10gige-agg-1
                     ID: groupnet0.subnet1.pool1
                 Ifaces: 37:10gige-agg-1, 38:10gige-agg-1, 39:10gige-agg-1, 40:10gige-agg-1
                     ID: groupnet0.subnet1.pool2
                 Ifaces: 37:10gige-agg-1, 38:10gige-agg-1, 39:10gige-agg-1, 40:10gige-agg-1

2) Run the IOCA check to determine cluster neighborhoods:
# perl IOCA -o 9.2.1.5,parallel -e -r "checkNetworkParallelUpgrade"
Isilon On-Cluster Analysis                        0.1395
Cluster Name                                      TestCluster
Cluster GUID                                      0050569b6db2ad086861001a2f1dd1d02473
Node Count                                        52
Current OneFS Version                             8.2.2.0
Destination OneFS Version                         9.2.1.5
Destination OneFS Version                         WARN
  WARN: There is a newer patch release available for OneFS 9.2.1: 9.2.1.9
Network Pools - Parallel Upgrade Support          FAIL
  CRITICAL: A parallel upgrade runs the risk of making one or more external networks temporarily unavailable. Affected pools: groupnet0.subnet0.pool1, groupnet0.subnet1.pool1, groupnet0.subnet1.pool2
  
  ==============================
  Node Neighborhoods
  ==============================
  1: [ 1, 7, 10, 16, 19, 24, 27, 31, 35, 40, 43, 45, 47 ]
  2: [ 2, 6, 9, 15, 18, 23, 26, 29, 33, 38, 41, 46, 48 ]
  3: [ 3, 5, 12, 14, 17, 22, 25, 30, 34, 37, 42, 50, 51 ]
  4: [ 4, 8, 11, 13, 20, 21, 28, 32, 36, 39, 44, 49, 52 ]

3) The possible resolution in this case would be to :

a) A quick fix would be to add all clusters nodes to the impacted network pools groupnet0.subnet0.pool1 & groupnet0.subnet1.pool1, groupnet0.subnet1.pool2
b) Add more nodes to affected network pools ( suggested nodes are based on neighborhood command output ) :

- Possible resolution to groupnet0.subnet0.pool1 : at least add node 7  to the network pool as node 7 exists in the same neighborhood as nodes 1
- Possible resolution to groupnet0.subnet1.pool1 : at least add node 34 to the network pool as node 34 exists in the same neighborhood as nodes 37
- Possible resolution to groupnet0.subnet1.pool2 : at least add node 33 to the network pool as node 33 exists in the same neighborhood as nodes 38

4) After applying the network changes, re-run the IOCA check to confirm that there are no issues:
# perl IOCA -o 9.2.1.5,parallel -e -r "checkNetworkParallelUpgrade" 

文章屬性
文章編號: 000196936
文章類型: Solution
上次修改時間: 13 5月 2026
版本:  10
向其他 Dell 使用者尋求您問題的答案
支援服務
檢查您的裝置是否在支援服務的涵蓋範圍內。