PowerStore:市场中非版本系统运行状况检查的登录页面

摘要: 有时,应在 PowerStoreOS 发布后添加运行状况检查。这些运行状况检查由精简软件包机制提供,可识别 PowerStore 群集中的各种已知问题。

本文适用于 本文不适用于 本文并非针对某种特定的产品。 本文并非包含所有产品版本。

说明

背景

在发布 PowerStoreOS 之后,偶尔会发现一些操作系统集成的运行状况检查和警报功能未检测到的新问题。运行状况检查精简软件包功能可用于向已安装的 PowerStoreOS 提供新的运行状况检查。  

运行状况检查软件包中包含在无中断升级 (NDU) 之前执行的运行状况检查。此外,该软件包还包含从 PowerStore Manager 按需调用的常规系统运行状况检查(通过依次单击 Monitoring > System Checks > Run System Check 进行调用)。

您必须将运行状况检查软件包上传到 PowerStore 群集,然后再进行安装。
 

重要提示
有关安装和使用运行状况检查程序包的详细说明,请参阅以下知识库文章之一:


目录

适用于 4.2.x 和 4.3.x 的运行状况检查程序包

下表列出了 PowerStore-health_check-4.3.0.0-2632792-retail.tgz.bin 运行状况检查精简软件包中的运行状况检查。此软件包仅与 PowerStoreOS 版本 4.2.x 和 4.3.x 兼容

运行状况检查程序包包含系统检查、升级前运行状况检查 (PUHC) 和 RxDefinitions 使用的验证。

提醒:  请参阅 PowerStore:RxDefinitions 问题登录页面 ,了解有关此程序包中包含的测试的信息。

 

分布:
Drivers & Downloads 中发布:(需要登录戴尔支持网站才能查看文档)

除非启用了自动下载,否则必须从此站点下载软件包。如果您启用自动下载选项,软件包将自动上传到群集(PowerStore Manager:Settings > Upgrades > Automatic download is enabled)。默认情况下,自动下载功能处于禁用状态。

如何安装:
上传软件包后,您必须安装它(PowerStore Manager:Upgrades > Upgrade)。

如何运行:

  • 从 PowerStore Manager UI 运行这些运行状况检查(Monitoring > System Checks > Run System Check。)
  • 或者,也可以使用服务脚本 svc_health_check
  • 从 PowerStore Manager UI 的“Upgrades”页面运行 PUHC 检查。在按下 Health Check 按钮时以及在按下 Upgrade 按钮时,都会运行它。

升级前运行状况检查 (PUHC)

图例:在此表中,符号 表示此最新的运行状况检查精简软件包中引入或增强的检查。

测试名称 描述 知识库文章 
PS 冗余  检测非冗余电源。 000214821 PowerStore:升级前运行状况检查 (PUHC) 检测到非冗余电源
scheduled_vm_snapshot  检测是否有任何虚拟机计划快照正在进行中 000214504 PowerStore:升级前运行状况检查 (PUHC) 检查所有快照命令是否都处于已完成状态。
off_release_ens24_drive_missing_path_check  检查系统是否存在故障或缺失的非冗余 NVMe 驱动器路径 000242170 PowerStore:升级前运行状况检查 (PUHC) 检测非冗余 NVMe 驱动器路径
off_release_incomplete_commands_check  PUHC 会检测不在 NDU 期间允许的命令的已批准列表中的不完整控制路径 (CP) 命令  000269892 PowerStore:升级前运行状况检查 (PUHC) 以检测未完成的 CP 命令
unsupported_drive_check  PUHC 检测到 DriveDB.json v0.6.6.0 未涵盖的驱动器的系统 000316788 PowerStore 运行状况检查,以确定具有 DriveDB.json v0.6.6.0 未涵盖的驱动器的系统
nvram_full_fips_check  PUHC 检测到 NVRAM 磁盘的完整 FIPS 设置不正确 000296977 PowerStore:系统运行状况检查和/或升级前运行状况检查 3.x/4.x |更换 NVMe NVRAM 磁盘可能会错误地引发 FIPS 警报
kernel_slab_check  检测是否有任何节点的板块分配超过skbuff_fclone_cache限制 000261124 PowerStore:运行状况检查:检测是否有任何节点的板块分配超过skbuff_fclone_cache限制 

系统检查

图例:在本表中,符号 表示在此最新的运行状况检查精简软件包中引入/增强的检查。

测试名称 描述 知识库文章  
four_port_iom_state_check  检测 4PortCard 是否错误地设置为 fru_is_not_in_use 000347815 PowerStore:系统运行状况检查检测到 4PortCard 错误地设置为 fru_is_not_in_use
indus_encryption_offset_check  检测 NVMe 扩展柜的驱动器无效加密带位置。 000220624 PowerStore:系统检查检测到 ENS24 机柜的驱动器无效加密带位置
unfinished_ndu_check  检测是否存在未完成的升级。 000213265 PowerStore:系统运行状况检查检测到 NDU 提交失败的残留
indus_drive_paths_check  检测通往 ENS24 NVMe 扩展柜的不稳定路径 000212444 PowerStore:系统运行状况检查检测通往 ENS24 NVMe 扩展柜的不稳定路径。
cpu_ierr_check  检查 CPU 内部错误 000196192 PowerStore:系统运行状况检查在 CPU IERR 检查中检测到问题
active_system_alert_check  检测活跃的主要警报和严重警报。 000192609 PowerStore:运行状况检查检测到的活动警报
cyc_node_space_check  检测到节点的 /cyc_node 目录空间不足。 000198173 PowerStore:系统运行状况检查检测到 cyc_node 中空间不足
time_skew_check 检测不受支持的大时间偏差 000196199 PowerStore:运行状况检查检测到节点和 BMC 上的高时间偏差
component_sn_check  检测不一致的 BBU 或 PSU 序列号 000196196 PowerStore:系统运行状况检查检测到组件序列号不一致:组件序列号检查
invalid_vg_uuid_check
检测在控制路径 (CP) 中没有成员的卷组是否存在  000238653 PowerStore:运行状况检查会检测是否存在没有成员的卷组 
kernel_slab_check 检测是否有任何节点的板块分配超过skbuff_fclone_cache限制 000261124 PowerStore:运行状况检查:检测是否有任何节点的板块分配超过skbuff_fclone_cache限制 
dp_mem_allocation_override_check 检测到错误的数据路径 (DP) 内存设置 000253246 PowerStore:系统运行状况检查检测到错误的数据路径内存设置 
unsupported_drive_check 检测 DriveDB.json v0.6.6.0 未涵盖驱动器的系统 000316788 PowerStore 运行状况检查,以确定具有 DriveDB.json v0.6.6.0 未涵盖的驱动器的系统

适用于 4.0.x 和 4.1.x 的运行状况检查程序包

下表列出了 PowerStore-health_check-4.1.0.0-2606757-retail.tgz.bin 运行状况检查精简软件包中的运行状况检查。此软件包仅与 PowerStoreOS 版本 4.0.x 和 4.1.x 兼容

运行状况检查包包含系统检查和升级前运行状况检查 (PUHC) 使用的验证。

分布:
Drivers & Downloads 中发布:(需要登录戴尔支持网站才能查看文档)

除非启用了自动下载,否则必须从此站点下载软件包。如果您启用自动下载选项,软件包将自动上传到群集(PowerStore Manager:Settings > Upgrades > Automatic download is enabled)。默认情况下,自动下载功能处于禁用状态。

如何安装:
上传软件包后,您必须安装它(PowerStore Manager:Upgrades > Upgrade)。

如何运行:

  • 从 PowerStore Manager UI 运行这些运行状况检查(Monitoring > System Checks > Run System Check。)
  • 或者,也可以使用服务脚本 svc_health_check
  • 从 PowerStore Manager UI 的“Upgrades”页面运行 PUHC 检查。在按下 Health Check 按钮时以及在按下 Upgrade 按钮时,都会运行它。

提醒:使用此运行状况检查软件包时,还要上传并安装 RxDefinitions 软件包。有关安装 RxDefinitions 软件包的更多详细信息,请参阅文章 PowerStore:RxDefinitions 问题的登录页面

升级前运行状况检查 (PUHC)

图例:在此表中,符号 表示此最新的运行状况检查精简软件包中引入或增强的检查。

测试名称 描述 知识库文章 
off_release_drive_firmware_check_oe PUHC 可防止在磁盘固件升级期间由于出现问题而导致系统不稳定 000367346 PowerStore:升级前运行状况检查 (PUHC),以防止磁盘固件升级期间出现问题导致系统不稳定
off_release_volume_metro_reservation_mode_check  检测一个或多个 Metro 卷是否卡在同步(同步数据库)状态。 000346226 PowerStore:升级前运行状况检查 (PUHC),以检测具有 SYM Metro 卷卡在同步数据库状态的 4.0.X Metro 系统
off_release_cpdb_locale_check  检测 PowerStore 管理或本地数据库中的区域设置或编码设置是否正确  000334747 PowerStore:CP 数据库服务器 (localdb/managementdb) 的数据库编码或区域设置未正确设置
 off_release_dpe_drive_check 检查具有 Indus 的 PowerStore500T 是否有足够的 DPE 驱动器。 000227055 PowerStore:升级前运行状况检查评估具有 NVMe 扩展柜 (ENS24) 的 PowerStore500T 是否有足够的 DPE 驱动器。
 off_release_check_iscsi_rep_block_size_failed 检测是否有大小为 4096 字节的卷正在通过 iSCSI 协议进行复制。 000221547 PowerStore:升级前运行状况检查 (PUHC) 检测到通过 iSCSI 协议复制 4096 VOLUME SECTOR SIZE 的卷
 off_release_rba_configuration_check 确定是否已配置 RBA 层。 000218438 PowerStore:升级前运行状况检查检测是否已启用 RBA 层。
 iom_activation_check 防止在未激活的情况下进行 IOM/SLIC 的 NDU。 000216558 PowerStore:运行状况检查检测到添加了 NVMe 扩展柜 (ENS24),但却无法识别它。
PS 冗余 检测非冗余电源。 000214821 PowerStore:升级前运行状况检查 (PUHC) 检测到非冗余电源
固件端口已锁定的 SAS 驱动器 检测锁定的固件端口 000207951 PowerStore:针对 Samsung SAS 驱动器中锁定的固件端口的升级前运行状况检查
off_release_ssd_in_rg_check 检测 SSD 是否不在 DRE 组中。 000218650 PowerStore:升级前运行状况检查检测到并非所有 SSD 都位于 RAID 组中
scheduled_vm_snapshot 检测是否有任何虚拟机计划快照正在进行中 000214504 PowerStore:升级前运行状况检查 (PUHC) 检查所有快照命令是否都处于已完成状态。
off_release_scsi3_reservation_check 检查系统是否存在任何过时的 SCSI3 保留  000246358 PowerStore:升级前运行状况检查以检测过时的 SCSI-3 保留问题
off_release_ens24_drive_missing_path_check 检查系统是否存在故障或缺失的非冗余 NVMe 驱动器路径 000242170 PowerStore:升级前运行状况检查 (PUHC) 检测非冗余 NVMe 驱动器路径
pd_manifest_version_check PUHC 可确保 PowerStore 中 Rx-Definitions 软件包的兼容性和版本控制  000228279 PowerStore:进行升级前运行状况检查 (PUHC),以确保 PowerStore 中的 Rx-Definitions 软件包的兼容性和版本控制
off_release_incomplete_commands_check  PUHC 会检测不在 NDU 期间允许的命令的已批准列表中的不完整控制路径 (CP) 命令  000269892 PowerStore:PUHC 检测不完整的 CP 命令 — off_release_incomplete_commands_check
unsupported_drive_check  PUHC 检测到 DriveDB.json v0.6.6.0 未涵盖的驱动器的系统 000316788 PowerStore:运行状况检查以识别具有 DriveDB.json v0.6.6.0 未涵盖的驱动器的系统
nvram_full_fips_check  PUHC 检测到 NVRAM 磁盘的完整 FIPS 设置不正确 000296977 PowerStore:系统运行状况检查和/或升级前运行状况检查 3.x/4.x |更换 NVMe NVRAM 磁盘可能会错误地引发 FIPS 警报
off_release_removed_third_party_certificate_check 检测缺失的第三方证书链 000261401 PowerStore:升级前运行状况检查 (PUHC) 以检测 reset_certificates REST 端点问题

 

系统检查

图例:在本表中,符号 表示在此最新的运行状况检查精简软件包中引入/增强的检查。

测试名称 描述 知识库文章  
four_port_iom_state_check  检测 4PortCard 是否错误地设置为 fru_is_not_in_use 000347815 PowerStore:系统运行状况检查检测到 4PortCard 错误地设置为 fru_is_not_in_use
indus_encryption_offset_check 检测 NVMe 扩展柜的驱动器无效加密带位置。 000220624 PowerStore:系统检查检测到 ENS24 机柜的驱动器无效加密带位置
unfinished_ndu_check  检测是否存在未完成的升级。 000213265 PowerStore:系统运行状况检查检测到 NDU 提交失败的残留
indus_drive_paths_check 检测通往 ENS24 NVMe 扩展柜的不稳定路径 000212444 PowerStore:系统运行状况检查检测通往 ENS24 NVMe 扩展柜的不稳定路径。
cpu_ierr_check 检查 CPU 内部错误 000196192 PowerStore:系统运行状况检查在 CPU IERR 检查中检测到问题
active_system_alert_check 检测活跃的主要警报和严重警报。 000192609 PowerStore:运行状况检查检测到的活动警报
cyc_node_space_check  检测到节点的 /cyc_node 目录空间不足。 000198173 PowerStore:系统运行状况检查检测到 cyc_node 中空间不足
time_skew_check 检测不受支持的大时间偏差 000196199 PowerStore:运行状况检查检测到节点和 BMC 上的高时间偏差
component_sn_check 检测不一致的 BBU 或 PSU 序列号 000196196 PowerStore:系统运行状况检查检测到组件序列号不一致:组件序列号检查
component_stale_fw_check 检测固件是否为最新版本以及是否与 Dell X.509 签名兼容 000201500 PowerStore:系统运行状况检查检测是否需要固件升级
symmd_on_disk_check 在磁盘上检测过时的 System Manager 磁盘元数据 (SYMMD) 数据 000228110 PowerStore:系统运行状况检查在磁盘上检测过时的 System Manager 磁盘元数据 (SYMMD) 数据
invalid_vg_uuid_check 
检测在控制路径 (CP) 中没有成员的卷组是否存在  000238653 PowerStore:运行状况检查会检测是否存在没有成员的卷组 
stale_scsi3_reservation_check  检测任何过时的 SCSI3 保留 000259473 PowerStore:系统运行状况检查检测到过时的 SCSI3 保留问题 
kernel_slab_check  检测是否有任何节点的板块分配超过skbuff_fclone_cache限制 000261124 PowerStore:运行状况检查:检测是否有任何节点的板块分配超过skbuff_fclone_cache限制 
dp_mem_allocation_override_check   检测到错误的数据路径 (DP) 内存设置 000253246 PowerStore:系统运行状况检查检测到错误的数据路径内存设置 
nvme_tcp_dmc_protection_check  检测运行 4.1.0.0 的设备是否可能需要跟进,以防止可能出现的数据完整性问题 000325258 PowerStore 运行状况检查以防止在具有 NVMe-TCP LUN 的 PowerStoreOS 4.1.0.0 群集上出现数据完整性情
unsupported_drive_check  检测 DriveDB.json v0.6.6.0 未涵盖驱动器的系统 000316788 PowerStore 运行状况检查,以确定具有 DriveDB.json v0.6.6.0 未涵盖的驱动器的系统
nvram_full_fips_check  检测到 NVRAM 磁盘的完整 FIPS 设置不正确 000296977 PowerStore:系统运行状况检查和/或升级前运行状况检查 3.x/4.x |更换 NVMe NVRAM 磁盘可能会错误地引发 FIPS 警报

 

适用于 3.x 的运行状况检查程序包

下表列出了 PowerStore-health_check-3.6.1.5-2613754-retail.tgz.bin 运行状况检查精简软件包中的运行状况检查。此软件包与 PowerStoreOS 版本 3.0.x、3.2.x、3.5.x 和 3.6(包括 3.6.1) 兼容 。它与 2.x 或 4.x 不兼容

运行状况检查包包含系统检查和升级前运行状况检查 (PUHC) 使用的验证。

分布:
Drivers & Downloads 中发布:(需要登录戴尔支持网站才能查看文档)

除非启用了自动下载,否则必须从此站点下载软件包。如果您启用自动下载选项,软件包将自动上传到群集(PowerStore Manager:Settings > Upgrades > Automatic download is enabled)。默认情况下,自动下载功能处于禁用状态。

如何安装:
上传软件包后,您必须安装它(PowerStore Manager:Upgrades > Upgrade)。

如何运行:

  • 从 PowerStore Manager UI 运行这些运行状况检查(Monitoring > System Checks > Run System Check。)
  • 或者,也可以使用服务脚本 svc_health_check
  • 从 PowerStore Manager UI 的“Upgrades”页面运行 PUHC 检查。在按下 Health Check 按钮时以及在按下 Upgrade 按钮时,都会运行它。


升级前运行状况检查 (PUHC)

图例:在本表中,符号 表示在此最新的运行状况检查精简软件包中引入/增强的检查。

测试名称 描述 知识库文章 
off_release_missing_pg_hba_conf_template_check 检测pg_hba是否缺少配置模板文件 000380454 PowerStore:升级前运行状况检查 (PUHC) 检测到缺少数据库pg_hba配置模板文件
off_release_nvme_discovered_initiators_check 检测未分配的NVME_FC启动器是否已分区并连接到 PowerStore 设备  000347818 PowerStore:升级前运行状况,以识别没有相应主机的启动器
off_release_cp_db_location_check 在多设备群集中,检测某些内部 PowerStore 组件是否由同一设备托管 000359310 PowerStore:升级前运行状况检查 (PUHC),以确认主控制路径 (CP) 和主数据库 (DB) 由同一设备托管
off_release_cpdb_locale_check  检测 PowerStore 管理或本地数据库中的区域设置或编码设置是否正确  000334747 PowerStore:CP 数据库服务器 (localdb/managementdb) 的数据库编码或区域设置未正确设置
off_release_check_ndu_pause_rule 检测是否在源作系统上启用了“NDU 暂停”功能,并验证目标作系统是否也支持此功能(如果适用)  000318226 PowerStore:阻止无中断升级 (NDU) 到不受支持的内部版本
off_release_locked_drive_check 检测驱动器是否处于锁定状态 000294377 PowerStore:每次升级运行状况检查,以检测驱动器是否被锁定 
off_release_nvram_full_fips_mode  检测是否正确设置了 NVRAM 磁盘的完整 FIPS 配置 000296977 PowerStore:系统运行状况检查和/或升级前运行状况检查 3.x/4.x |更换 NVMe NVRAM 磁盘可能会错误地引发 FIPS 警报
off_release_unsupported_drive_check   检测是否在系统driveDB.json文件中找到所有已安装的驱动器 000316788 PowerStore 运行状况检查,以确定具有 DriveDB.json v0.6.6.0 未涵盖的驱动器的系统
off_release_check_db_rep_mode_failed  检测并阻止由 3 个或 4 个设备组成的群集升级到 PowerStoreOS 4.1 000286668 PowerStore:在具有三个或更多设备的群集上升级到 PowerStoreOS 4.1 后,管理数据库复制可能仍处于异步模式
 off_release_drive_wear_check 确定是否存在磨损程度过高的驱动器。 000227058 PowerStore:升级前运行状况检查 (PUHC) 确定是否存在磨损程度过高的驱动器。
 off_release_dpe_drive_check 检查具有 Indus 的 PowerStore500T 是否有足够的 DPE 驱动器, 000227055 PowerStore:升级前运行状况检查评估具有 NVMe 扩展柜 (ENS24) 的 PowerStore500T 是否有足够的 DPE 驱动器。
off_release_drivedb_check 检测错误的驱动器数据库文件。 000224852 PowerStore:升级前运行状况检查 (PUHC) 检测错误的驱动器数据库签名。
 off_release_check_iscsi_rep_block_size_failed 检测是否有大小为 4096 字节的卷正在通过 iSCSI 协议进行复制。 000221547 PowerStore:升级前运行状况检查 (PUHC) 检测到通过 iSCSI 协议复制 4096 VOLUME SECTOR SIZE 的卷
 efi_boot_check
 off_release_efi_boot_check
检查是否使用了正确的启动项选项。 000222187 PowerStore:升级前运行状况检查可检测是否使用了错误的启动项选项重新引导
 off_release_rba_configuration_check 确定是否已配置 RBA 层。 000218438 PowerStore:升级前运行状况检查检测是否已启用 RBA 层。
 iom_activation_check 防止在未激活的情况下进行 IOM/SLIC 的 NDU。 000216558 PowerStore:运行状况检查检测到添加了 NVMe 扩展柜 (ENS24),但却无法识别它。
silent_drive_failure_check 检测底层固件升级过程是否正在运行。 000216659 PowerStore:运行状况检查检测到缺失 SSD 问题
off_release_check_proc_install_disk_firmware 检测底层固件升级过程是否正在运行。 000218391 PowerStore:升级前运行状况检查检测到底层固件升级过程正在运行
off_release_ssd_in_rg_check 检测 SSD 是否不在 DRE 组中。 000218650 PowerStore:升级前运行状况检查检测到并非所有 SSD 都位于 RAID 组中
固件端口已锁定的 SAS 驱动器 检测锁定的固件端口 000207951 PowerStore:针对 Samsung SAS 驱动器中锁定的固件端口的升级前运行状况检查
PS 冗余  检测非冗余电源。 000214821 PowerStore:升级前运行状况检查 (PUHC) 检测到非冗余电源
replication_session_state 检测到复制会话正在进行中。 000214505 PowerStore:升级前运行状况检查 (PUHC) 检测到复制处于阻止 NDU 的状态。
scheduled_vm_snapshot 检测是否有任何虚拟机计划快照正在进行中。 000214504 PowerStore:升级前运行状况检查 (PUHC) 检查所有快照命令是否都处于已完成状态。
off_release_check_chap_authentication off_release_check_chap_authentication 000214503 PowerStore:升级前运行状况检查 (PUHC) 检测是否正确配置 CHAP 转接连接。
维护窗口已配置。 检测是否已配置维护窗口。仅适用于系统不会在 NDU 之前自动启用维护窗口的操作系统版本。 000212508 PowerStore:升级前运行状况检查 (PUHC) 检测到尚未配置维护窗口
检测辅助 IP 问题。 检测 NVMe 扩展柜上的辅助 IP 问题 000215560 PowerStore:升级前运行状况检查 (PUHC) 检测到 ENS24 NVMe 扩展柜上的辅助 IP 设置存在问题。
SDNAS 快照限制 检测 SDNAS 快照是否超出其限制。 000206131 PowerStore:系统运行状况检查检测到已超出 SDNAS 快照限制  
重复固件条目检查 在节点的简历(注册表)中检测重复的组件固件条目。 000203390 PowerStore:系统运行状况检查检测到重复的固件条目。 
启动器连接检查 检测是否存在任何非冗余启动器。 000196194 PowerStore:系统运行状况检查检测到非冗余启动器。
设置重新启动标记 检测是否设置重新启动标记。 000205908 PowerStore:系统运行状况检查检测到已设置重新启动标记。
恢复分区映像检查 在恢复分区中检测错误的文件名。 000200075 PowerStore:系统运行状况检查检测恢复分区中是否有错误的文件名。
off_release_sdnas_remote_network_alert_check 检测 NAS 复制接口不匹配的情况 000201904 PowerStore:升级前运行状况检查 (PUHC) 检测到 NAS 复制会话的接口不匹配
off_release_stale_scsi3_reg_check 检查系统是否存在任何过时的 SCSI3 保留  000246358 PowerStore:升级前运行状况检查 (PUHC) 检测到过时的 SCSI3 保留问题
empty_vg_no_memebers   检测在控制路径 (CP) 中没有成员的卷组是否存在 000238653 PowerStore:运行状况检查会检测是否存在没有成员的卷组
off_release_ens24_drive_missing_path_check  检查系统是否存在故障或缺失的非冗余 NVMe 驱动器路径 000242170 PowerStore:升级前运行状况检查 (PUHC) 检测非冗余 NVMe 驱动器路径
off_release_scsi3_reservation_check  检查系统是否存在任何现有的 SCSI3 保留  000233544 PowerStore:升级前运行状况检查检测现有的 SCSI3 保留
off_release_sdnas_last_event_id_check  检测 SdnasLastProcessedEventId 编号是否大到足以导致内存不足问题 000227865 PowerStore:升级前运行状况检查 (PUHC) 检测 SdnasLastProcessedEventId 编号是否大到足以导致内存不足问题
 off_release_new_firmware_zip_existence_check  检测丢失的预暂存固件 zip 文件问题,以防止 NDU 故障 000228388 PowerStore:升级前运行状况检查 (PUHC) 检测新的固件 zip 是否已从固件分区阶段抹除
off_release_sdnas_memory_config   检测平台对 NAS 容器的限制与 NAS 尝试在内部分配的限制之间是否存在不匹配 000250803 PowerStore:升级前运行状况检查 (PUHC) 以检测 SDNAS 内存配置问题
off_release_nvme_reservation_check  检测群集上是否存在 NVMe 保留  000269902 PowerStore:升级前运行状况检查 (PUHC),以检测群集上是否存在 NVMe 保留
off_release_dp_mem_override_file_exists 检测是否存在现有的数据路径 (DP) 内存覆盖文件 000271492 PowerStore:升级前运行状况检查 (PUHC),以检测数据路径内存的 OOM 覆盖
off_release_removed_third_party_certificate_check  检测缺失的第三方证书链 000261401 PowerStore:升级前运行状况检查 (PUHC) 以检测 reset_certificates REST 端点问题
user_db_fewer_records 在必要时检测受影响设备的节点之间的user.db条目是否丢失或不同  000263789 PowerStore:升级前运行状况检查 (PUHC),以检测节点之间是否有必要user.db条目丢失或条目不同
off_release_vol_in_destroying_state_check   检测卷是否处于“Destroying”状态 000258991 PowerStore:升级前运行状况检查 (PUHC),以检测处于“正在销毁”状态的卷
off_release_incomplete_commands_check   检测不在 NDU 期间允许的命令的已批准列表中的不完整控制路径 (CP) 命令  000269892 PowerStore:进行升级前运行状况检查 (PUHC),以检测未在 NDU 期间允许的命令的已批准列表中的未完成的 CP 命令
off_release_inter_cluster_tcp_conn_check    检测部分群集间 TCP 连接 000285925 PowerStore:升级前运行状况检查 (PUHC),以检测部分群集间 TCP 连接
off_release_stale_gsips_in_remote_rtps_check 
检测远程相对目标端口 (RTP) 中遗留的任何不存在的全局存储发现 IP (GSIP)  000266610 PowerStore:升级前运行状况检查,以检测远程 RTP 中的过时 GSIP

 

系统检查

图例:在本表中,符号 表示在此最新的运行状况检查精简软件包中引入/增强的检查。

测试名称 描述 知识库文章  
off_release_nvram_full_fips_mode   检测是否正确设置了 NVRAM 磁盘的完整 FIPS 配置 000296977 PowerStore:系统运行状况检查和/或升级前运行状况检查 3.x/4.x |更换 NVMe NVRAM 磁盘可能会错误地引发 FIPS 警报
off_release_unsupported_drive_check  检测是否在系统driveDB.json文件中找到所有已安装的驱动器 000316788 PowerStore 运行状况检查,以确定具有 DriveDB.json v0.6.6.0 未涵盖的驱动器的系统
ppds_dsb_check 检测过时的 DSB 信息 000224714 PowerStore:系统检查检测到平台数据服务信息已过时。
indus_encryption_offset_check 检测 NVMe 扩展柜的驱动器无效加密带位置。 000220624 PowerStore:系统检查检测 NVMe 扩展柜 (ENS24) 的驱动器无效加密带位置。
dp_dedupe_destage_leak_check  检测导致过度驱动器磨损的不需要的降级。 000220203 PowerStore:系统检查检测到不必要的转储
kr_link_boot_option_check 检测 500T 设备的两个节点上是否未启用 KR 链路 PXE 启动选项。 000220804 PowerStore:系统检查检测 PowerStore 500T 设备的两个节点上是否未启用 KR 链路 PXE 启动选项。
iom_activation_check 防止在未激活的情况下进行 IOM/SLIC 的 NDU。 000216558 PowerStore:运行状况检查检测到添加了 NVMe 扩展柜 (ENS24),但却无法识别它。
dp_resiliency_mode_check 检测弹性模式的非正常退出(vDisk 问题) 000217840 PowerStore:系统检查检测到设备不必要地保持在弹性模式下。
sdnas_capacity_alert_check 检测升级后是否禁用了文件系统容量警报。 000217839 PowerStore:升级后禁用文件系统使用容量警报。
unfinished_ndu_check 检测是否存在未完成的升级。 000213265 PowerStore:系统运行状况检查检测到 NDU 提交失败的残留物。
silent_drive_failure_check 检测知识库文章 000216381 中的 PowerStore 问题:SSD 发生故障且未显示警报。 000216659 PowerStore:运行状况检查检测缺少 SSD 的问题。
target_port_group_id_check 检测影响 NVMeoF 卷映射的目标端口组问题 000216953 PowerStore:系统运行状况检查检测到可能影响 NVMeoF 卷映射的目标端口组问题。
indus_drive_paths_check 检测通往 ENS24 NVMe 扩展柜的不稳定路径 000212444 PowerStore:系统运行状况检查检测通往 ENS24 NVMe 扩展柜的不稳定路径。
dimm_sn_check 检测 DIMM 序列号中的不一致情况 00207658 PowerStore:系统运行状况检查检测到不一致的 DIMM 序列号。
recovery_partition_image_check   在恢复分区中检测错误的文件名 000200075 PowerStore:系统运行状况检查检测恢复分区中是否有错误的文件名。 
duplicate_fw_entry_check 在节点的简历(注册表)中检测重复的组件固件条目。  000203390 PowerStore:系统运行状况检查检测到重复的固件条目。
cpu_ierr_check 检查 CPU 内部错误 000196192 PowerStore:系统运行状况检查在 CPU IERR 检查中检测到问题。
InitiatorConnectivityCheck  检测非冗余启动器 000196194 PowerStore:系统运行状况检查检测到非冗余启动器。
icd_network_check 检测到缺少与 ToR 的连接 000196193 PowerStore:系统运行状况检查检测到 ICD 网络连接问题。
dimm_correctable_error_check 检测 DIMM 可纠正错误 (CE) 数(5k 阈值) 000199245 PowerStore:系统运行状况检查检测到过多的 DIMM 可纠正错误 (CE) 数。
active_system_alert_check 检测活跃的主要警报和严重警报。 000192609 PowerStore:运行状况检查检测到活跃的警报。
cyc_node_space_check  检测到节点的 /cyc_node 目录空间不足。 000198173 PowerStore:系统运行状况检查检测到 /cyc_node 中的空间不足。
time_skew_check 检测不受支持的大时间偏差 000196199 PowerStore:系统运行状况检查在节点和 BMC 上检测到时间偏差较大。
db_tmpfiles_check  检测数据库临时文件是否大于预期 000196198 PowerStore:系统运行状况检查检测到大型数据库临时文件。
bbu_sensor_check 在各种 BBU 运行状况检查中检测故障 000196197PowerStore:系统运行状况检查检测到无效的电池状态。
component_sn_check 检测不一致的 BBU 或 PSU 序列号 000196196 PowerStore:系统运行状况检查检测到组件序列号不一致:fru_items_sn_check
fsck_leftover_check 检测是否存在 fsck 生成的文件 cyc-sys-mode-override.txt。 000201738 PowerStore:系统运行状况检查检测到恢复文件。
component_stale_fw_check 检测固件是否为最新版本以及是否与 Dell X.509 签名兼容 000201500 PowerStore:系统运行状况检查检测是否需要固件升级
transit_connection_check 检测数据路径中是否存在转接连接对象 000226767 PowerStore:系统检查检测到孤立的转接连接对象
symmd_on_disk_check
检测磁盘上是否保存了最新的 System Manager 磁盘元数据 (SYMMD) 数据 000228110 PowerStore:系统运行状况检查在磁盘上检测过时的 System Manager 磁盘元数据 (SYMMD) 数据
kernel_slab_check
检测是否有任何节点的板块分配超过skbuff_fclone_cache限制 000261124 PowerStore:系统运行状况检查可检测是否有任何节点的板块分配超过skbuff_fclone_cache限制

 

适用于 2.1.x 的运行状况检查程序包

下表列出了 PowerStore-health_check-2.1.1.2-2069723-retail.tgz.bin 运行状况检查精简软件包中的运行状况检查。此软件包与 PowerStoreOS 版本 2.1.x 兼容 。它与版本 3.x 或 4.x 不兼容

此软件包中包含用于常规运行状况监视和升级前运行状况检查的系统检查。建议定期检查系统运行状况,并在执行维护操作之前进行检查。在执行 NDU 之前,需要执行升级前运行状况检查。

分发:
Drivers & Downloads 中发布:(需要登录戴尔支持网站才能查看文档)

必须从此站点下载软件包。

如何安装:
上传软件包后,您必须安装它(PowerStore Manager:Upgrades > Upgrade)。

如何运行: 

  • 从 PowerStore Manager UI 运行系统运行状况检查(Monitoring > System Checks > Run System Check。)
  • 从 PowerStore Manager UI 运行升级前运行状况检查(Monitoring > System Checks > Upgrade Extension。)
  • 或者,也可以使用服务脚本 svc_health_check。 
测试名称 描述 故障知识库文章
mtc_drive_counter_check 检测 MTC NVRAM 驱动器问题 000212587 PowerStore:系统运行状况检查检测 MTC NVRAM 驱动器问题。
drive_flags_check 检测脱机和故障的驱动器,其中包括不发出警报的驱动器 000207485 PowerStore:系统运行状况检查检测脱机或故障的 SSD。
bbu_sensor_check 在各种 BBU 运行状况检查中检测故障 000196197 PowerStore:系统运行状况检查检测到无效的电池状态。
kms_lockbox_file_check 检测 dare 密码箱的问题 000196653 PowerStore:运行状况检查检测到密码箱存在问题。
os_package_name_check 在恢复分区中检测错误的文件名 000200075 PowerStore:运行状况检查检测到文件名、恢复分区或 PowerStoreOS 软件包版本存在问题。
duplicate_fw_entry_check 在节点的简历(注册表)中检测重复的组件固件条目。     000203390 PowerStore:系统运行状况检查检测到重复的固件条目。
fsck_leftover_check 检测意外的恢复文件 000201738 PowerStore:系统运行状况检查检测到恢复文件。
recovery_partition_image_check  在恢复分区中检测错误的文件名 000200075 PowerStore:系统运行状况检查检测恢复分区中是否有错误的文件名。
symmetric_icm_connection 检测缺少的 ICM 连接 000203115 PowerStore:非对称 ICM 连接的运行状况检查包检查失败
cpu_ierr_check 检查 CPU 内部错误 000196192 PowerStore:系统运行状况检查在 CPU IERR 检查中检测到问题。
InitiatorConnectivityCheck 检测非冗余启动器 000196194 PowerStore:系统运行状况检查检测到非冗余启动器。
icd_network_check 检测到缺少与 ToR 的连接 000196193 PowerStore:系统运行状况检查检测到 ICD 网络连接问题。
symmd_fw_upgrade_flag_check 检测处于无效状态的 PSU 000199922 PowerStore:系统运行状况检查检测到错误的 PSU 状态。
dimm_correctable_error_check 检测 DIMM CE 数(5k 阈值) 000199245 PowerStore:系统运行状况检查检测到过多的 DIMM 可纠正错误 (CE) 数。
active_system_alert_check 检测活跃的主要警报和严重警报 000192609 PowerStore:运行状况检查检测到活跃的警报。
cyc_node_space_check 检测到节点的 /cyc_node 目录空间不足。 000198173 PowerStore:系统运行状况检查检测到 /cyc_node 中的空间不足。
time_skew_check 检测不受支持的大时间偏差 000196199 PowerStore:系统运行状况检查在节点和 BMC 上检测到时间偏差较大。
db_tmpfiles_check 检测数据库临时文件是否大于预期 000196198 PowerStore:系统运行状况检查检测到大型数据库临时文件。
bbu_ipmi_i2c_check
在各种 BBU 运行状况检查中检测故障 000196197 PowerStore:系统运行状况检查检测到无效的电池状态。
 ru_items_sn_check 检测不一致的 BBU 或 PSU 序列号 000196196 PowerStore:系统运行状况检查检测到组件序列号不一致:fru_items_sn_check

 

受影响的产品

PowerStore
文章属性
文章编号: 000214752
文章类型: How To
上次修改时间: 07 1月 2026
版本:  37
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。