PowerStore:市场中非版本系统运行状况检查的登录页面
Summary: 有时,应在 PowerStoreOS 发布后添加运行状况检查。这些运行状况检查由精简软件包机制提供,可识别 PowerStore 群集中的各种已知问题。
Instructions
背景
在发布 PowerStoreOS 之后,偶尔会发现一些操作系统集成的运行状况检查和警报功能未检测到的新问题。运行状况检查精简软件包功能可用于向已安装的 PowerStoreOS 提供新的运行状况检查。
运行状况检查软件包中包含在无中断升级 (NDU) 之前执行的运行状况检查。此外,该软件包还包含从 PowerStore Manager 按需调用的常规系统运行状况检查(通过依次单击 Monitoring > System Checks > Run System Check 进行调用)。
您必须将运行状况检查软件包上传到 PowerStore 群集,然后再进行安装。
| 重要提示 |
|---|
有关安装和使用运行状况检查程序包的详细说明,请参阅以下知识库文章之一:
|
目录
适用于 4.2.x 的运行状况检查程序包
下表列出了 PowerStore-health_check-4.2.0.0-2598072-retail.tgz.bin 运行状况检查精简软件包中的运行状况检查。此软件包仅与 PowerStoreOS 版本 4.2.x 兼容 。
运行状况检查程序包包含系统检查、升级前运行状况检查 (PUHC) 和 RxDefinitions 使用的验证。
提醒: 请参阅 PowerStore:RxDefinitions 问题登录页面 ,了解有关此程序包中包含的测试的信息。
分配:
在 Drivers & Downloads 中发布:(需要登录戴尔支持网站才能查看文档)
除非启用了自动下载,否则必须从此站点下载软件包。如果您启用自动下载选项,软件包将自动上传到群集(PowerStore Manager:Settings > Upgrades > Automatic download is enabled)。默认情况下,自动下载功能处于禁用状态。
如何安装:
上传软件包后,您必须安装它(PowerStore Manager:Upgrades > Upgrade)。
如何运行:
- 从 PowerStore Manager UI 运行这些运行状况检查(Monitoring > System Checks > Run System Check。)
- 或者,也可以使用服务脚本
svc_health_check。 - 从 PowerStore Manager UI 的“Upgrades”页面运行 PUHC 检查。在按下 Health Check 按钮时以及在按下 Upgrade 按钮时,都会运行它。
升级前运行状况检查 (PUHC)
图例:在此表中,符号 ♦ 表示此最新的运行状况检查精简软件包中引入或增强的检查。
| 测试名称 | 描述 | 知识库文章 |
|---|---|---|
| PS 冗余 | 检测非冗余电源。 | 000214821 PowerStore:升级前运行状况检查 (PUHC) 检测到非冗余电源 |
| scheduled_vm_snapshot | 检测是否有任何虚拟机计划快照正在进行中 | 000214504 PowerStore:升级前运行状况检查 (PUHC) 检查所有快照命令是否都处于已完成状态。 |
| off_release_ens24_drive_missing_path_check | 检查系统是否存在故障或缺失的非冗余 NVMe 驱动器路径 | 000242170 PowerStore:升级前运行状况检查 (PUHC) 检测非冗余 NVMe 驱动器路径 |
| off_release_incomplete_commands_check | PUHC 会检测不在 NDU 期间允许的命令的已批准列表中的不完整控制路径 (CP) 命令 | 000269892 PowerStore:升级前运行状况检查 (PUHC) 以检测未完成的 CP 命令 |
| unsupported_drive_check | PUHC 检测到 DriveDB.json v0.6.6.0 未涵盖的驱动器的系统 | 000316788 PowerStore 运行状况检查,以确定具有 DriveDB.json v0.6.6.0 未涵盖的驱动器的系统 |
| nvram_full_fips_check | PUHC 检测到 NVRAM 磁盘的完整 FIPS 设置不正确 | 000296977 PowerStore:系统运行状况检查和/或升级前运行状况检查 3.x/4.x |更换 NVMe NVRAM 磁盘可能会错误地引发 FIPS 警报 |
kernel_slab_check |
检测是否有任何节点的板块分配超过skbuff_fclone_cache限制 | 000261124 PowerStore:运行状况检查:检测是否有任何节点的板块分配超过skbuff_fclone_cache限制 |
系统检查
图例:在本表中,符号 ♦ 表示在此最新的运行状况检查精简软件包中引入/增强的检查。
| 测试名称 | 描述 | 知识库文章 |
|---|---|---|
| four_port_iom_state_check | 检测 4PortCard 是否错误地设置为 fru_is_not_in_use | 000347815 PowerStore:系统运行状况检查检测到 4PortCard 错误地设置为 fru_is_not_in_use |
| indus_encryption_offset_check | 检测 NVMe 扩展柜的驱动器无效加密带位置。 | 000220624 PowerStore:系统检查检测到 ENS24 机柜的驱动器无效加密带位置 |
| unfinished_ndu_check | 检测是否存在未完成的升级。 | 000213265 PowerStore:系统运行状况检查检测到 NDU 提交失败的残留 |
| indus_drive_paths_check | 检测通往 ENS24 NVMe 扩展柜的不稳定路径 | 000212444 PowerStore:系统运行状况检查检测通往 ENS24 NVMe 扩展柜的不稳定路径。 |
| cpu_ierr_check | 检查 CPU 内部错误 | 000196192 PowerStore:系统运行状况检查在 CPU IERR 检查中检测到问题 |
| active_system_alert_check | 检测活跃的主要警报和严重警报。 | 000192609 PowerStore:运行状况检查检测到的活动警报 |
| cyc_node_space_check | 检测到节点的 /cyc_node 目录空间不足。 | 000198173 PowerStore:系统运行状况检查检测到 cyc_node 中空间不足 |
| time_skew_check | 检测不受支持的大时间偏差 | 000196199 PowerStore:运行状况检查检测到节点和 BMC 上的高时间偏差 |
| component_sn_check | 检测不一致的 BBU 或 PSU 序列号 | 000196196 PowerStore:系统运行状况检查检测到组件序列号不一致:组件序列号检查 |
|
检测在控制路径 (CP) 中没有成员的卷组是否存在 | 000238653 PowerStore:运行状况检查会检测是否存在没有成员的卷组 |
kernel_slab_check |
检测是否有任何节点的板块分配超过skbuff_fclone_cache限制 | 000261124 PowerStore:运行状况检查:检测是否有任何节点的板块分配超过skbuff_fclone_cache限制 |
| dp_mem_allocation_override_check | 检测到错误的数据路径 (DP) 内存设置 | 000253246 PowerStore:系统运行状况检查检测到错误的数据路径内存设置 |
| unsupported_drive_check | 检测 DriveDB.json v0.6.6.0 未涵盖驱动器的系统 | 000316788 PowerStore 运行状况检查,以确定具有 DriveDB.json v0.6.6.0 未涵盖的驱动器的系统 |
适用于 4.0.x 和 4.1.x 的运行状况检查程序包
下表列出了 PowerStore-health_check-4.1.0.0-2606757-retail.tgz.bin 运行状况检查精简软件包中的运行状况检查。此软件包仅与 PowerStoreOS 版本 4.0.x 和 4.1.x 兼容 。
运行状况检查包包含系统检查和升级前运行状况检查 (PUHC) 使用的验证。
分配:
在 Drivers & Downloads 中发布:(需要登录戴尔支持网站才能查看文档)
除非启用了自动下载,否则必须从此站点下载软件包。如果您启用自动下载选项,软件包将自动上传到群集(PowerStore Manager:Settings > Upgrades > Automatic download is enabled)。默认情况下,自动下载功能处于禁用状态。
如何安装:
上传软件包后,您必须安装它(PowerStore Manager:Upgrades > Upgrade)。
如何运行:
- 从 PowerStore Manager UI 运行这些运行状况检查(Monitoring > System Checks > Run System Check。)
- 或者,也可以使用服务脚本
svc_health_check。 - 从 PowerStore Manager UI 的“Upgrades”页面运行 PUHC 检查。在按下 Health Check 按钮时以及在按下 Upgrade 按钮时,都会运行它。
提醒:使用此运行状况检查软件包时,还要上传并安装 RxDefinitions 软件包。有关安装 RxDefinitions 软件包的更多详细信息,请参阅文章 PowerStore:RxDefinitions 问题的登录页面。
升级前运行状况检查 (PUHC)
图例:在此表中,符号 ♦ 表示此最新的运行状况检查精简软件包中引入或增强的检查。
| 测试名称 | 描述 | 知识库文章 |
|---|---|---|
| off_release_drive_firmware_check_oe | PUHC 可防止在磁盘固件升级期间由于出现问题而导致系统不稳定 | 000367346 PowerStore:升级前运行状况检查 (PUHC),以防止磁盘固件升级期间出现问题导致系统不稳定 |
| off_release_volume_metro_reservation_mode_check | 检测一个或多个 Metro 卷是否卡在同步(同步数据库)状态。 | 000346226 PowerStore:升级前运行状况检查 (PUHC),以检测具有 SYM Metro 卷卡在同步数据库状态的 4.0.X Metro 系统 |
| off_release_cpdb_locale_check | 检测 PowerStore 管理或本地数据库中的区域设置或编码设置是否正确 | 000334747 PowerStore:CP 数据库服务器 (localdb/managementdb) 的数据库编码或区域设置未正确设置 |
| off_release_dpe_drive_check | 检查具有 Indus 的 PowerStore500T 是否有足够的 DPE 驱动器。 | 000227055 PowerStore:升级前运行状况检查评估具有 NVMe 扩展柜 (ENS24) 的 PowerStore500T 是否有足够的 DPE 驱动器。 |
| off_release_check_iscsi_rep_block_size_failed | 检测是否有大小为 4096 字节的卷正在通过 iSCSI 协议进行复制。 | 000221547 PowerStore:升级前运行状况检查 (PUHC) 检测到通过 iSCSI 协议复制 4096 VOLUME SECTOR SIZE 的卷 |
| off_release_rba_configuration_check | 确定是否已配置 RBA 层。 | 000218438 PowerStore:升级前运行状况检查检测是否已启用 RBA 层。 |
| iom_activation_check ♦ | 防止在未激活的情况下进行 IOM/SLIC 的 NDU。 | 000216558 PowerStore:运行状况检查检测到添加了 NVMe 扩展柜 (ENS24),但却无法识别它。 |
| PS 冗余 | 检测非冗余电源。 | 000214821 PowerStore:升级前运行状况检查 (PUHC) 检测到非冗余电源 |
| 固件端口已锁定的 SAS 驱动器 | 检测锁定的固件端口 | 000207951 PowerStore:针对 Samsung SAS 驱动器中锁定的固件端口的升级前运行状况检查 |
| off_release_ssd_in_rg_check | 检测 SSD 是否不在 DRE 组中。 | 000218650 PowerStore:升级前运行状况检查检测到并非所有 SSD 都位于 RAID 组中 |
| scheduled_vm_snapshot | 检测是否有任何虚拟机计划快照正在进行中 | 000214504 PowerStore:升级前运行状况检查 (PUHC) 检查所有快照命令是否都处于已完成状态。 |
| off_release_scsi3_reservation_check | 检查系统是否存在任何过时的 SCSI3 保留 | 000246358 PowerStore:升级前运行状况检查以检测过时的 SCSI-3 保留问题 |
| off_release_ens24_drive_missing_path_check | 检查系统是否存在故障或缺失的非冗余 NVMe 驱动器路径 | 000242170 PowerStore:升级前运行状况检查 (PUHC) 检测非冗余 NVMe 驱动器路径 |
| pd_manifest_version_check | PUHC 可确保 PowerStore 中 Rx-Definitions 软件包的兼容性和版本控制 | 000228279 PowerStore:进行升级前运行状况检查 (PUHC),以确保 PowerStore 中的 Rx-Definitions 软件包的兼容性和版本控制 |
| off_release_incomplete_commands_check | PUHC 会检测不在 NDU 期间允许的命令的已批准列表中的不完整控制路径 (CP) 命令 | 000269892 PowerStore:PUHC 检测不完整的 CP 命令 — off_release_incomplete_commands_check |
| unsupported_drive_check | PUHC 检测到 DriveDB.json v0.6.6.0 未涵盖的驱动器的系统 | 000316788 PowerStore:运行状况检查以识别具有 DriveDB.json v0.6.6.0 未涵盖的驱动器的系统 |
| nvram_full_fips_check | PUHC 检测到 NVRAM 磁盘的完整 FIPS 设置不正确 | 000296977 PowerStore:系统运行状况检查和/或升级前运行状况检查 3.x/4.x |更换 NVMe NVRAM 磁盘可能会错误地引发 FIPS 警报 |
| off_release_removed_third_party_certificate_check ♦ | 检测缺失的第三方证书链 | 000261401 PowerStore:升级前运行状况检查 (PUHC) 以检测 reset_certificates REST 端点问题 |
系统检查
图例:在本表中,符号 ♦ 表示在此最新的运行状况检查精简软件包中引入/增强的检查。
| 测试名称 | 描述 | 知识库文章 |
|---|---|---|
| four_port_iom_state_check | 检测 4PortCard 是否错误地设置为 fru_is_not_in_use | 000347815 PowerStore:系统运行状况检查检测到 4PortCard 错误地设置为 fru_is_not_in_use |
| indus_encryption_offset_check | 检测 NVMe 扩展柜的驱动器无效加密带位置。 | 000220624 PowerStore:系统检查检测到 ENS24 机柜的驱动器无效加密带位置 |
| unfinished_ndu_check | 检测是否存在未完成的升级。 | 000213265 PowerStore:系统运行状况检查检测到 NDU 提交失败的残留 |
| indus_drive_paths_check | 检测通往 ENS24 NVMe 扩展柜的不稳定路径 | 000212444 PowerStore:系统运行状况检查检测通往 ENS24 NVMe 扩展柜的不稳定路径。 |
| cpu_ierr_check | 检查 CPU 内部错误 | 000196192 PowerStore:系统运行状况检查在 CPU IERR 检查中检测到问题 |
| active_system_alert_check | 检测活跃的主要警报和严重警报。 | 000192609 PowerStore:运行状况检查检测到的活动警报 |
| cyc_node_space_check | 检测到节点的 /cyc_node 目录空间不足。 | 000198173 PowerStore:系统运行状况检查检测到 cyc_node 中空间不足 |
| time_skew_check | 检测不受支持的大时间偏差 | 000196199 PowerStore:运行状况检查检测到节点和 BMC 上的高时间偏差 |
| component_sn_check ♦ | 检测不一致的 BBU 或 PSU 序列号 | 000196196 PowerStore:系统运行状况检查检测到组件序列号不一致:组件序列号检查 |
| component_stale_fw_check | 检测固件是否为最新版本以及是否与 Dell X.509 签名兼容 | 000201500 PowerStore:系统运行状况检查检测是否需要固件升级 |
| symmd_on_disk_check | 在磁盘上检测过时的 System Manager 磁盘元数据 (SYMMD) 数据 | 000228110 PowerStore:系统运行状况检查在磁盘上检测过时的 System Manager 磁盘元数据 (SYMMD) 数据 |
|
检测在控制路径 (CP) 中没有成员的卷组是否存在 | 000238653 PowerStore:运行状况检查会检测是否存在没有成员的卷组 |
| stale_scsi3_reservation_check | 检测任何过时的 SCSI3 保留 | 000259473 PowerStore:系统运行状况检查检测到过时的 SCSI3 保留问题 |
kernel_slab_check |
检测是否有任何节点的板块分配超过skbuff_fclone_cache限制 | 000261124 PowerStore:运行状况检查:检测是否有任何节点的板块分配超过skbuff_fclone_cache限制 |
| dp_mem_allocation_override_check | 检测到错误的数据路径 (DP) 内存设置 | 000253246 PowerStore:系统运行状况检查检测到错误的数据路径内存设置 |
| nvme_tcp_dmc_protection_check | 检测运行 4.1.0.0 的设备是否可能需要跟进,以防止可能出现的数据完整性问题 | 000325258 PowerStore 运行状况检查以防止在具有 NVMe-TCP LUN 的 PowerStoreOS 4.1.0.0 群集上出现数据完整性情形 |
| unsupported_drive_check | 检测 DriveDB.json v0.6.6.0 未涵盖驱动器的系统 | 000316788 PowerStore 运行状况检查,以确定具有 DriveDB.json v0.6.6.0 未涵盖的驱动器的系统 |
| nvram_full_fips_check | 检测到 NVRAM 磁盘的完整 FIPS 设置不正确 | 000296977 PowerStore:系统运行状况检查和/或升级前运行状况检查 3.x/4.x |更换 NVMe NVRAM 磁盘可能会错误地引发 FIPS 警报 |
适用于 3.x 的运行状况检查程序包
下表列出了 PowerStore-health_check-3.6.1.5-2613754-retail.tgz.bin 运行状况检查精简软件包中的运行状况检查。此软件包与 PowerStoreOS 版本 3.0.x、3.2.x、3.5.x 和 3.6(包括 3.6.1) 兼容 。它与 2.x 或 4.x 不兼容 。
运行状况检查包包含系统检查和升级前运行状况检查 (PUHC) 使用的验证。
分配:
在 Drivers & Downloads 中发布:(需要登录戴尔支持网站才能查看文档)
除非启用了自动下载,否则必须从此站点下载软件包。如果您启用自动下载选项,软件包将自动上传到群集(PowerStore Manager:Settings > Upgrades > Automatic download is enabled)。默认情况下,自动下载功能处于禁用状态。
如何安装:
上传软件包后,您必须安装它(PowerStore Manager:Upgrades > Upgrade)。
如何运行:
- 从 PowerStore Manager UI 运行这些运行状况检查(Monitoring > System Checks > Run System Check。)
- 或者,也可以使用服务脚本
svc_health_check。 - 从 PowerStore Manager UI 的“Upgrades”页面运行 PUHC 检查。在按下 Health Check 按钮时以及在按下 Upgrade 按钮时,都会运行它。
升级前运行状况检查 (PUHC)
图例:在本表中,符号 ♦ 表示在此最新的运行状况检查精简软件包中引入/增强的检查。
| 测试名称 | 描述 | 知识库文章 |
|---|---|---|
| off_release_missing_pg_hba_conf_template_check ♦ | 检测pg_hba是否缺少配置模板文件 | 000380454 PowerStore:升级前运行状况检查 (PUHC) 检测到缺少数据库pg_hba配置模板文件 |
| off_release_nvme_discovered_initiators_check | 检测未分配的NVME_FC启动器是否已分区并连接到 PowerStore 设备 | 000347818 PowerStore:升级前运行状况,以识别没有相应主机的启动器 |
| off_release_cp_db_location_check | 在多设备群集中,检测某些内部 PowerStore 组件是否由同一设备托管 | 000359310 PowerStore:升级前运行状况检查 (PUHC),以确认主控制路径 (CP) 和主数据库 (DB) 由同一设备托管 |
| off_release_cpdb_locale_check | 检测 PowerStore 管理或本地数据库中的区域设置或编码设置是否正确 | 000334747 PowerStore:CP 数据库服务器 (localdb/managementdb) 的数据库编码或区域设置未正确设置 |
| off_release_check_ndu_pause_rule | 检测是否在源作系统上启用了“NDU 暂停”功能,并验证目标作系统是否也支持此功能(如果适用) | 000318226 PowerStore:阻止无中断升级 (NDU) 到不受支持的内部版本 |
| off_release_locked_drive_check | 检测驱动器是否处于锁定状态 | 000294377 PowerStore:每次升级运行状况检查,以检测驱动器是否被锁定 |
| off_release_nvram_full_fips_mode | 检测是否正确设置了 NVRAM 磁盘的完整 FIPS 配置 | 000296977 PowerStore:系统运行状况检查和/或升级前运行状况检查 3.x/4.x |更换 NVMe NVRAM 磁盘可能会错误地引发 FIPS 警报 |
| off_release_unsupported_drive_check | 检测是否在系统driveDB.json文件中找到所有已安装的驱动器 | 000316788 PowerStore 运行状况检查,以确定具有 DriveDB.json v0.6.6.0 未涵盖的驱动器的系统 |
| off_release_check_db_rep_mode_failed | 检测并阻止由 3 个或 4 个设备组成的群集升级到 PowerStoreOS 4.1 | 000286668 PowerStore:在具有三个或更多设备的群集上升级到 PowerStoreOS 4.1 后,管理数据库复制可能仍处于异步模式 |
| off_release_drive_wear_check | 确定是否存在磨损程度过高的驱动器。 | 000227058 PowerStore:升级前运行状况检查 (PUHC) 确定是否存在磨损程度过高的驱动器。 |
| off_release_dpe_drive_check | 检查具有 Indus 的 PowerStore500T 是否有足够的 DPE 驱动器, | 000227055 PowerStore:升级前运行状况检查评估具有 NVMe 扩展柜 (ENS24) 的 PowerStore500T 是否有足够的 DPE 驱动器。 |
| off_release_drivedb_check | 检测错误的驱动器数据库文件。 | 000224852 PowerStore:升级前运行状况检查 (PUHC) 检测错误的驱动器数据库签名。 |
| off_release_check_iscsi_rep_block_size_failed | 检测是否有大小为 4096 字节的卷正在通过 iSCSI 协议进行复制。 | 000221547 PowerStore:升级前运行状况检查 (PUHC) 检测到通过 iSCSI 协议复制 4096 VOLUME SECTOR SIZE 的卷 |
| efi_boot_check off_release_efi_boot_check |
检查是否使用了正确的启动项选项。 | 000222187 PowerStore:升级前运行状况检查可检测是否使用了错误的启动项选项重新引导 |
| off_release_rba_configuration_check | 确定是否已配置 RBA 层。 | 000218438 PowerStore:升级前运行状况检查检测是否已启用 RBA 层。 |
| iom_activation_check | 防止在未激活的情况下进行 IOM/SLIC 的 NDU。 | 000216558 PowerStore:运行状况检查检测到添加了 NVMe 扩展柜 (ENS24),但却无法识别它。 |
| silent_drive_failure_check | 检测底层固件升级过程是否正在运行。 | 000216659 PowerStore:运行状况检查检测到缺失 SSD 问题 |
| off_release_check_proc_install_disk_firmware | 检测底层固件升级过程是否正在运行。 | 000218391 PowerStore:升级前运行状况检查检测到底层固件升级过程正在运行 |
| off_release_ssd_in_rg_check | 检测 SSD 是否不在 DRE 组中。 | 000218650 PowerStore:升级前运行状况检查检测到并非所有 SSD 都位于 RAID 组中 |
| 固件端口已锁定的 SAS 驱动器 | 检测锁定的固件端口 | 000207951 PowerStore:针对 Samsung SAS 驱动器中锁定的固件端口的升级前运行状况检查 |
| PS 冗余 | 检测非冗余电源。 | 000214821 PowerStore:升级前运行状况检查 (PUHC) 检测到非冗余电源 |
| replication_session_state | 检测到复制会话正在进行中。 | 000214505 PowerStore:升级前运行状况检查 (PUHC) 检测到复制处于阻止 NDU 的状态。 |
| scheduled_vm_snapshot | 检测是否有任何虚拟机计划快照正在进行中。 | 000214504 PowerStore:升级前运行状况检查 (PUHC) 检查所有快照命令是否都处于已完成状态。 |
| off_release_check_chap_authentication | off_release_check_chap_authentication | 000214503 PowerStore:升级前运行状况检查 (PUHC) 检测是否正确配置 CHAP 转接连接。 |
| 维护窗口已配置。 | 检测是否已配置维护窗口。仅适用于系统不会在 NDU 之前自动启用维护窗口的操作系统版本。 | 000212508 PowerStore:升级前运行状况检查 (PUHC) 检测到尚未配置维护窗口 |
| 检测辅助 IP 问题。 | 检测 NVMe 扩展柜上的辅助 IP 问题 | 000215560 PowerStore:升级前运行状况检查 (PUHC) 检测到 ENS24 NVMe 扩展柜上的辅助 IP 设置存在问题。 |
| SDNAS 快照限制 | 检测 SDNAS 快照是否超出其限制。 | 000206131 PowerStore:系统运行状况检查检测到已超出 SDNAS 快照限制 |
| 重复固件条目检查 | 在节点的简历(注册表)中检测重复的组件固件条目。 | 000203390 PowerStore:系统运行状况检查检测到重复的固件条目。 |
| 启动器连接检查 | 检测是否存在任何非冗余启动器。 | 000196194 PowerStore:系统运行状况检查检测到非冗余启动器。 |
| 设置重新启动标记 | 检测是否设置重新启动标记。 | 000205908 PowerStore:系统运行状况检查检测到已设置重新启动标记。 |
| 恢复分区映像检查 | 在恢复分区中检测错误的文件名。 | 000200075 PowerStore:系统运行状况检查检测恢复分区中是否有错误的文件名。 |
| off_release_sdnas_remote_network_alert_check | 检测 NAS 复制接口不匹配的情况 | 000201904 PowerStore:升级前运行状况检查 (PUHC) 检测到 NAS 复制会话的接口不匹配 |
| off_release_stale_scsi3_reg_check | 检查系统是否存在任何过时的 SCSI3 保留 | 000246358 PowerStore:升级前运行状况检查 (PUHC) 检测到过时的 SCSI3 保留问题 |
| empty_vg_no_memebers | 检测在控制路径 (CP) 中没有成员的卷组是否存在 | 000238653 PowerStore:运行状况检查会检测是否存在没有成员的卷组 |
| off_release_ens24_drive_missing_path_check | 检查系统是否存在故障或缺失的非冗余 NVMe 驱动器路径 | 000242170 PowerStore:升级前运行状况检查 (PUHC) 检测非冗余 NVMe 驱动器路径 |
| off_release_scsi3_reservation_check | 检查系统是否存在任何现有的 SCSI3 保留 | 000233544 PowerStore:升级前运行状况检查检测现有的 SCSI3 保留 |
| off_release_sdnas_last_event_id_check | 检测 SdnasLastProcessedEventId 编号是否大到足以导致内存不足问题 | 000227865 PowerStore:升级前运行状况检查 (PUHC) 检测 SdnasLastProcessedEventId 编号是否大到足以导致内存不足问题 |
| off_release_new_firmware_zip_existence_check | 检测丢失的预暂存固件 zip 文件问题,以防止 NDU 故障 | 000228388 PowerStore:升级前运行状况检查 (PUHC) 检测新的固件 zip 是否已从固件分区阶段抹除 |
| off_release_sdnas_memory_config | 检测平台对 NAS 容器的限制与 NAS 尝试在内部分配的限制之间是否存在不匹配 | 000250803 PowerStore:升级前运行状况检查 (PUHC) 以检测 SDNAS 内存配置问题 |
| off_release_nvme_reservation_check | 检测群集上是否存在 NVMe 保留 | 000269902 PowerStore:升级前运行状况检查 (PUHC),以检测群集上是否存在 NVMe 保留 |
| off_release_dp_mem_override_file_exists | 检测是否存在现有的数据路径 (DP) 内存覆盖文件 | 000271492 PowerStore:升级前运行状况检查 (PUHC),以检测数据路径内存的 OOM 覆盖 |
| off_release_removed_third_party_certificate_check | 检测缺失的第三方证书链 | 000261401 PowerStore:升级前运行状况检查 (PUHC) 以检测 reset_certificates REST 端点问题 |
| user_db_fewer_records | 在必要时检测受影响设备的节点之间的user.db条目是否丢失或不同 | 000263789 PowerStore:升级前运行状况检查 (PUHC),以检测节点之间是否有必要user.db条目丢失或条目不同 |
| off_release_vol_in_destroying_state_check | 检测卷是否处于“Destroying”状态 | 000258991 PowerStore:升级前运行状况检查 (PUHC),以检测处于“正在销毁”状态的卷 |
| off_release_incomplete_commands_check | 检测不在 NDU 期间允许的命令的已批准列表中的不完整控制路径 (CP) 命令 | 000269892 PowerStore:进行升级前运行状况检查 (PUHC),以检测未在 NDU 期间允许的命令的已批准列表中的未完成的 CP 命令 |
| off_release_inter_cluster_tcp_conn_check | 检测部分群集间 TCP 连接 | 000285925 PowerStore:升级前运行状况检查 (PUHC),以检测部分群集间 TCP 连接 |
off_release_stale_gsips_in_remote_rtps_check |
检测远程相对目标端口 (RTP) 中遗留的任何不存在的全局存储发现 IP (GSIP) | 000266610 PowerStore:升级前运行状况检查,以检测远程 RTP 中的过时 GSIP |
系统检查
图例:在本表中,符号 ♦ 表示在此最新的运行状况检查精简软件包中引入/增强的检查。
| 测试名称 | 描述 | 知识库文章 |
|---|---|---|
| off_release_nvram_full_fips_mode | 检测是否正确设置了 NVRAM 磁盘的完整 FIPS 配置 | 000296977 PowerStore:系统运行状况检查和/或升级前运行状况检查 3.x/4.x |更换 NVMe NVRAM 磁盘可能会错误地引发 FIPS 警报 |
| off_release_unsupported_drive_check | 检测是否在系统driveDB.json文件中找到所有已安装的驱动器 | 000316788 PowerStore 运行状况检查,以确定具有 DriveDB.json v0.6.6.0 未涵盖的驱动器的系统 |
| ppds_dsb_check | 检测过时的 DSB 信息 | 000224714 PowerStore:系统检查检测到平台数据服务信息已过时。 |
| indus_encryption_offset_check | 检测 NVMe 扩展柜的驱动器无效加密带位置。 | 000220624 PowerStore:系统检查检测 NVMe 扩展柜 (ENS24) 的驱动器无效加密带位置。 |
| dp_dedupe_destage_leak_check | 检测导致过度驱动器磨损的不需要的降级。 | 000220203 PowerStore:系统检查检测到不必要的转储 |
| kr_link_boot_option_check | 检测 500T 设备的两个节点上是否未启用 KR 链路 PXE 启动选项。 | 000220804 PowerStore:系统检查检测 PowerStore 500T 设备的两个节点上是否未启用 KR 链路 PXE 启动选项。 |
| iom_activation_check | 防止在未激活的情况下进行 IOM/SLIC 的 NDU。 | 000216558 PowerStore:运行状况检查检测到添加了 NVMe 扩展柜 (ENS24),但却无法识别它。 |
| dp_resiliency_mode_check | 检测弹性模式的非正常退出(vDisk 问题) | 000217840 PowerStore:系统检查检测到设备不必要地保持在弹性模式下。 |
| sdnas_capacity_alert_check | 检测升级后是否禁用了文件系统容量警报。 | 000217839 PowerStore:升级后禁用文件系统使用容量警报。 |
| unfinished_ndu_check | 检测是否存在未完成的升级。 | 000213265 PowerStore:系统运行状况检查检测到 NDU 提交失败的残留物。 |
| silent_drive_failure_check | 检测知识库文章 000216381 中的 PowerStore 问题:SSD 发生故障且未显示警报。 | 000216659 PowerStore:运行状况检查检测缺少 SSD 的问题。 |
| target_port_group_id_check | 检测影响 NVMeoF 卷映射的目标端口组问题 | 000216953 PowerStore:系统运行状况检查检测到可能影响 NVMeoF 卷映射的目标端口组问题。 |
| indus_drive_paths_check | 检测通往 ENS24 NVMe 扩展柜的不稳定路径 | 000212444 PowerStore:系统运行状况检查检测通往 ENS24 NVMe 扩展柜的不稳定路径。 |
| dimm_sn_check | 检测 DIMM 序列号中的不一致情况 | 00207658 PowerStore:系统运行状况检查检测到不一致的 DIMM 序列号。 |
| recovery_partition_image_check | 在恢复分区中检测错误的文件名 | 000200075 PowerStore:系统运行状况检查检测恢复分区中是否有错误的文件名。 |
| duplicate_fw_entry_check | 在节点的简历(注册表)中检测重复的组件固件条目。 | 000203390 PowerStore:系统运行状况检查检测到重复的固件条目。 |
| cpu_ierr_check | 检查 CPU 内部错误 | 000196192 PowerStore:系统运行状况检查在 CPU IERR 检查中检测到问题。 |
| InitiatorConnectivityCheck | 检测非冗余启动器 | 000196194 PowerStore:系统运行状况检查检测到非冗余启动器。 |
| icd_network_check | 检测到缺少与 ToR 的连接 | 000196193 PowerStore:系统运行状况检查检测到 ICD 网络连接问题。 |
| dimm_correctable_error_check | 检测 DIMM 可纠正错误 (CE) 数(5k 阈值) | 000199245 PowerStore:系统运行状况检查检测到过多的 DIMM 可纠正错误 (CE) 数。 |
| active_system_alert_check | 检测活跃的主要警报和严重警报。 | 000192609 PowerStore:运行状况检查检测到活跃的警报。 |
| cyc_node_space_check | 检测到节点的 /cyc_node 目录空间不足。 | 000198173 PowerStore:系统运行状况检查检测到 /cyc_node 中的空间不足。 |
| time_skew_check | 检测不受支持的大时间偏差 | 000196199 PowerStore:系统运行状况检查在节点和 BMC 上检测到时间偏差较大。 |
| db_tmpfiles_check | 检测数据库临时文件是否大于预期 | 000196198 PowerStore:系统运行状况检查检测到大型数据库临时文件。 |
| bbu_sensor_check | 在各种 BBU 运行状况检查中检测故障 | 000196197PowerStore:系统运行状况检查检测到无效的电池状态。 |
| component_sn_check | 检测不一致的 BBU 或 PSU 序列号 | 000196196 PowerStore:系统运行状况检查检测到组件序列号不一致:fru_items_sn_check |
| fsck_leftover_check | 检测是否存在 fsck 生成的文件 cyc-sys-mode-override.txt。 | 000201738 PowerStore:系统运行状况检查检测到恢复文件。 |
| component_stale_fw_check | 检测固件是否为最新版本以及是否与 Dell X.509 签名兼容 | 000201500 PowerStore:系统运行状况检查检测是否需要固件升级。 |
| transit_connection_check | 检测数据路径中是否存在转接连接对象 | 000226767 PowerStore:系统检查检测到孤立的转接连接对象 |
symmd_on_disk_check |
检测磁盘上是否保存了最新的 System Manager 磁盘元数据 (SYMMD) 数据 | 000228110 PowerStore:系统运行状况检查在磁盘上检测过时的 System Manager 磁盘元数据 (SYMMD) 数据 |
|
检测是否有任何节点的板块分配超过skbuff_fclone_cache限制 | 000261124 PowerStore:系统运行状况检查可检测是否有任何节点的板块分配超过skbuff_fclone_cache限制 |
适用于 2.1.x 的运行状况检查程序包
下表列出了 PowerStore-health_check-2.1.1.2-2069723-retail.tgz.bin 运行状况检查精简软件包中的运行状况检查。此软件包与 PowerStoreOS 版本 2.1.x 兼容 。它与版本 3.x 或 4.x 不兼容。
此软件包中包含用于常规运行状况监视和升级前运行状况检查的系统检查。建议定期检查系统运行状况,并在执行维护操作之前进行检查。在执行 NDU 之前,需要执行升级前运行状况检查。
分发:
在 Drivers & Downloads 中发布:(需要登录戴尔支持网站才能查看文档)
必须从此站点下载软件包。
如何安装:
上传软件包后,您必须安装它(PowerStore Manager:Upgrades > Upgrade)。
如何运行:
- 从 PowerStore Manager UI 运行系统运行状况检查(Monitoring > System Checks > Run System Check。)
- 从 PowerStore Manager UI 运行升级前运行状况检查(Monitoring > System Checks > Upgrade Extension。)
- 或者,也可以使用服务脚本
svc_health_check。
| 测试名称 | 描述 | 故障知识库文章 |
|---|---|---|
| mtc_drive_counter_check | 检测 MTC NVRAM 驱动器问题 | 000212587 PowerStore:系统运行状况检查检测 MTC NVRAM 驱动器问题。 |
| drive_flags_check | 检测脱机和故障的驱动器,其中包括不发出警报的驱动器 | 000207485 PowerStore:系统运行状况检查检测脱机或故障的 SSD。 |
| bbu_sensor_check | 在各种 BBU 运行状况检查中检测故障 | 000196197 PowerStore:系统运行状况检查检测到无效的电池状态。 |
| kms_lockbox_file_check | 检测 dare 密码箱的问题 | 000196653 PowerStore:运行状况检查检测到密码箱存在问题。 |
| os_package_name_check | 在恢复分区中检测错误的文件名 | 000200075 PowerStore:运行状况检查检测到文件名、恢复分区或 PowerStoreOS 软件包版本存在问题。 |
| duplicate_fw_entry_check | 在节点的简历(注册表)中检测重复的组件固件条目。 | 000203390 PowerStore:系统运行状况检查检测到重复的固件条目。 |
| fsck_leftover_check | 检测意外的恢复文件 | 000201738 PowerStore:系统运行状况检查检测到恢复文件。 |
| recovery_partition_image_check | 在恢复分区中检测错误的文件名 | 000200075 PowerStore:系统运行状况检查检测恢复分区中是否有错误的文件名。 |
| symmetric_icm_connection | 检测缺少的 ICM 连接 | 000203115 PowerStore:非对称 ICM 连接的运行状况检查包检查失败 |
| cpu_ierr_check | 检查 CPU 内部错误 | 000196192 PowerStore:系统运行状况检查在 CPU IERR 检查中检测到问题。 |
| InitiatorConnectivityCheck | 检测非冗余启动器 | 000196194 PowerStore:系统运行状况检查检测到非冗余启动器。 |
| icd_network_check | 检测到缺少与 ToR 的连接 | 000196193 PowerStore:系统运行状况检查检测到 ICD 网络连接问题。 |
| symmd_fw_upgrade_flag_check | 检测处于无效状态的 PSU | 000199922 PowerStore:系统运行状况检查检测到错误的 PSU 状态。 |
| dimm_correctable_error_check | 检测 DIMM CE 数(5k 阈值) | 000199245 PowerStore:系统运行状况检查检测到过多的 DIMM 可纠正错误 (CE) 数。 |
| active_system_alert_check | 检测活跃的主要警报和严重警报 | 000192609 PowerStore:运行状况检查检测到活跃的警报。 |
| cyc_node_space_check | 检测到节点的 /cyc_node 目录空间不足。 | 000198173 PowerStore:系统运行状况检查检测到 /cyc_node 中的空间不足。 |
| time_skew_check | 检测不受支持的大时间偏差 | 000196199 PowerStore:系统运行状况检查在节点和 BMC 上检测到时间偏差较大。 |
| db_tmpfiles_check | 检测数据库临时文件是否大于预期 | 000196198 PowerStore:系统运行状况检查检测到大型数据库临时文件。 |
|
bbu_ipmi_i2c_check
|
在各种 BBU 运行状况检查中检测故障 | 000196197 PowerStore:系统运行状况检查检测到无效的电池状态。 |
| ru_items_sn_check | 检测不一致的 BBU 或 PSU 序列号 | 000196196 PowerStore:系统运行状况检查检测到组件序列号不一致:fru_items_sn_check |