PowerScale:Isilon:Isilon On-Cluster Analysis:网络池 — 并行升级支持

摘要: 本知识库文章提供了有关 IOCA 检查的更多详细信息以及有关并行升级的一般概述。

本文适用于 本文不适用于 本文并非针对某种特定的产品。 本文并非包含所有产品版本。

症状

Isilon On-Cluster Analysis 报告的输出类似于以下内容:
 
Network Pools - Parallel Upgrade Support          FAIL

CRITICAL: A parallel upgrade runs the risk of making one or more external networks temporarily unavailable. Affected pools: groupnet0.subnet0.pool1, groupnet0.subnet1.pool1, groupnet0.subnet1.pool2

原因

  • 这是设计使然,因为群集具有非连续外部网络,可能存在受影响网络池中所有节点同时重新启动的风险。
  • 在这种情况下,客户端无法通过与该网络池关联的 SmartConnect 分区名称 (SCZN) 访问群集。 

解决方案

在阅读解决方案之前,最好先了解并行升级的工作原理。

重要定义:
 

  • 磁盘池:  分布在群集节点子集中的磁盘集合。 
  • 保护级别/策略:/ifs 文件系统上的所有文件都分配有保护级别。OneFS 跨单个磁盘池的节点和驱动器对文件内容进行条带化或镜像。保护级别为 2d+1n 的文件可保证当封闭磁盘池中的任何两个驱动器或一个节点发生故障时,该文件仍可用。
  • 社区:  完全包含一个或多个磁盘池的节点集。分配给磁盘池的节点子集可能与分配给另一个邻近区域的节点子集重叠。邻近区域之间没有磁盘池重叠。 
  • 磁盘池数据库 API 和保留磁盘池数据库 API 具有保留功能,允许客户端应用程序(如升级框架)从群集中删除一组节点(即重新启动)或驱动器,而不会破坏任何磁盘池上的保护。
  • 非连续外部网络:如果某个群集有一组节点的外部接口在所有磁盘池中都不重叠,则该群集具有非连续外部网络

并行升级 — 顶层概述:
  • 并行升级将在所有节点上安装新的作系统,然后同时重新启动一部分节点,每个磁盘池中最多重新启动一个节点。
  • 每个节点都会尝试为其重新启动创建保留,直至所有节点升级完成。  节点子集和保留基于磁盘池和节点可用性。
  • 在并行升级期间,未重新启动的节点子集将保持在线状态,并可继续为客户端提供服务。

检查定义:
  • 群集具有非连续外部网络(KB 示例:groupnet0.subnet0.pool1、groupnet0.subnet1.pool1、groupnet0.subnet1.pool2)
  • 在并行升级期间,这些网络池上可能存在 DU 风险,因为受影响网络池中的所有节点可能同时重新启动(即,它们可能使用磁盘池保留同时重新启动)。 
  • 如果发生这种情况,将无法访问受影响的网络池的 SCZN。 

关于解决方案的说明:
  • 由于每个群集具有不同的网络配置,因此并非所有群集的解决方案都相同。
  • 为避免在并行升级期间在非连续网络池上出现 DU,需要更改群集和外部环境的网络配置,这通常需要客户进行多次批准。
  • 本知识库文章不包括上述几点导致的 IOCA 检查失败的直接解决方法。
  • 但是,一般准则是,受影响网络池中至少两个节点的外部成员接口存在于同一邻域/故障域上,以避免该 SmartConnect 网络池的不连续网络/DU 风险(即,将同一邻域/故障域中的节点添加到受影响的网络池)。 
  • 知识库文章提供了有关如何确定群集的邻近域/故障域和受影响网络池中的成员节点的命令。

解决方案: 
  • 使用以下命令确定受影响网络池中的成员节点(提醒:替换“<network-pool 1 ID> | <network-pool 2 ID> | <network-pool 3 ID>替换为来自 IOCA 检查详细信息的受影响网络池 ID,并使用“|”字符在它们之间分隔)。 
# isi network pools list -v | egrep -i 'ID: |ifaces' | egrep -A1 '<network-pool 1 ID> | <network-pool 2 ID> | <network-pool 3 ID>'
  • 运行以下命令以确定群集的邻近区域(提醒将<IOCA 脚本位置> 和<新 OneFS 版本> 及其正确值) 
# perl <IOCA script location> -o <New OneFS version>,parallel  -e -r "checkNetworkParallelUpgrade"  
  • 交叉引用上述命令的输出,以确定需要对群集的网络池进行哪些更改。
  • 快速修复方法是将所有群集节点添加到受影响的网络池,但这通常不容易办到,因为外部网络环境可能不允许进行此更改。
  • 应用所需的更改后,再次重新运行 IOCA 检查。
  • 如果无法确定所需的更改,请向支持部门提交案例以获得进一步的帮助。
  • 下面的示例用于确定测试方案中所需的更改:
1) Determine member nodes in affected network pools:
# isi network pools list -v | grep -i 'ID: |ifaces' | egrep -A1 'groupnet0.subnet0.pool1| groupnet0.subnet1.pool1| groupnet0.subnet1.pool2'
                     ID: groupnet0.subnet0.pool1
                 Ifaces: 1:10gige-agg-1, 2:10gige-agg-1, 4:10gige-agg-1, 3:10gige-agg-1
                     ID: groupnet0.subnet1.pool1
                 Ifaces: 37:10gige-agg-1, 38:10gige-agg-1, 39:10gige-agg-1, 40:10gige-agg-1
                     ID: groupnet0.subnet1.pool2
                 Ifaces: 37:10gige-agg-1, 38:10gige-agg-1, 39:10gige-agg-1, 40:10gige-agg-1

2) Run the IOCA check to determine cluster neighborhoods:
# perl IOCA -o 9.2.1.5,parallel -e -r "checkNetworkParallelUpgrade"
Isilon On-Cluster Analysis                        0.1395
Cluster Name                                      TestCluster
Cluster GUID                                      0050569b6db2ad086861001a2f1dd1d02473
Node Count                                        52
Current OneFS Version                             8.2.2.0
Destination OneFS Version                         9.2.1.5
Destination OneFS Version                         WARN
  WARN: There is a newer patch release available for OneFS 9.2.1: 9.2.1.9
Network Pools - Parallel Upgrade Support          FAIL
  CRITICAL: A parallel upgrade runs the risk of making one or more external networks temporarily unavailable. Affected pools: groupnet0.subnet0.pool1, groupnet0.subnet1.pool1, groupnet0.subnet1.pool2
  
  ==============================
  Node Neighborhoods
  ==============================
  1: [ 1, 7, 10, 16, 19, 24, 27, 31, 35, 40, 43, 45, 47 ]
  2: [ 2, 6, 9, 15, 18, 23, 26, 29, 33, 38, 41, 46, 48 ]
  3: [ 3, 5, 12, 14, 17, 22, 25, 30, 34, 37, 42, 50, 51 ]
  4: [ 4, 8, 11, 13, 20, 21, 28, 32, 36, 39, 44, 49, 52 ]

3) The possible resolution in this case would be to :

a) A quick fix would be to add all clusters nodes to the impacted network pools groupnet0.subnet0.pool1 & groupnet0.subnet1.pool1, groupnet0.subnet1.pool2
b) Add more nodes to affected network pools ( suggested nodes are based on neighborhood command output ) :

- Possible resolution to groupnet0.subnet0.pool1 : at least add node 7  to the network pool as node 7 exists in the same neighborhood as nodes 1
- Possible resolution to groupnet0.subnet1.pool1 : at least add node 34 to the network pool as node 34 exists in the same neighborhood as nodes 37
- Possible resolution to groupnet0.subnet1.pool2 : at least add node 33 to the network pool as node 33 exists in the same neighborhood as nodes 38

4) After applying the network changes, re-run the IOCA check to confirm that there are no issues:
# perl IOCA -o 9.2.1.5,parallel -e -r "checkNetworkParallelUpgrade" 

文章属性
文章编号: 000196936
文章类型: Solution
上次修改时间: 13 5月 2026
版本:  10
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。