PowerStore:市场中非发布版本系统运行状况检查的登录页面
摘要: 有时,应在 PowerStoreOS 发布后添加运行状况检查。这些运行状况检查由精简软件包机制提供,可识别 PowerStore 群集中的各种已知问题。
说明
背景
在发布 PowerStoreOS 之后,偶尔会发现一些操作系统集成的运行状况检查和警报功能未检测到的新问题。运行状况检查精简软件包功能可用于向已安装的 PowerStoreOS 提供新的运行状况检查。
运行状况检查软件包中包含在无中断升级 (NDU) 之前执行的运行状况检查。该软件包还包含常规系统运行状况检查,您可以根据需要在 PowerStore Manager (Monitoring > System Checks > Run System Check)。
必须将运行状况检查软件包上传到 PowerStore 群集,然后进行安装。
有关安装和使用运行状况检查软件包的详细说明,请参阅以下知识库文章之一:
- 知识库文章 192601 PowerStore:如何使用升级前运行状况检查和系统检查在软件升级前检查群集的运行状况
- 知识库文章 198084 PowerStore:如何使用系统检查功能。
目录
- 适用于 4.2.x、4.3 和 4.4.x 的运行状况检查软件包
- 适用于 4.0.x 和 4.1.x 的运行状况检查软件包
- 适用于 3.x 的运行状况检查软件包
- 适用于 2.1.x 的运行状况检查软件包
适用于 4.2.x、4.3.x 和 4.4.x 的运行状况检查软件包。
下表列出了 PowerStore-health_check-4.4.0.0-2720358-retail.tgz.bin 运行状况检查精简软件包。此软件包仅与 PowerStoreOS 版本 4.2.x、4.3.x 和 4.4.x 兼容。
请参阅 PowerStore:RxDefinitions 问题登录页面,了解有关此软件包中所包含测试的信息。
升级前运行状况检查 (PUHC)
图例:在本表中,符号 * 表示在此最新的运行状况检查精简软件包中引入或增强的检查。
表 1.PowerStore-health_check-4.4.0.0-2720358-retail.tgz.bin运行状况检查
| 测试名称 | 描述 | 知识库文章 |
|---|---|---|
PS Redundancy |
检测非冗余电源 | PowerStore:升级前运行状况检查 (PUHC) 检测非冗余电源 |
scheduled_vm_snapshot |
检测是否有任何虚拟机计划快照正在进行中 | PowerStore:升级前运行状况检查 (PUHC) 检查所有快照命令是否都处于已完成状态。 |
ens24_drive_missing_path_check |
检查系统是否存在故障或缺失的非冗余 NVMe 驱动器路径 | PowerStore:升级前运行状况检查 (PUHC) 检测非冗余 NVMe 驱动器路径 |
incomplete_commands_check |
PUHC 检测到未完成的控制路径 (CP) 命令,这些命令不在 NDU 期间允许执行的已批准列表中 | PowerStore:升级前运行状况检查 (PUHC) 检测未完成的 CP 命令 |
unsupported_drive_check |
PUHC 检测到系统中存在 DriveDB.json v0.6.6.0 未涵盖的驱动器 | PowerStore 运行状况检查识别系统中存在 DriveDB.json v0.6.6.0 未涵盖的驱动器 |
nvram_full_fips_check |
检测 NVRAM 磁盘的完整 FIPS 设置不正确 | PowerStore:系统运行状况检查和/或升级前运行状况检查 3.x/4.x | 更换 NVMe NVRAM 磁盘可能会错误地引发 FIPS 警报 |
kernel_slab_check |
检测是否有任何节点的层块分配超过 skbuff_fclone_cache 限制 | PowerStore:运行状况检查检测是否有任何节点的层块分配超过 skbuff_fclone_cache 限制 |
duplicate_or_inconsistent_ntp_addresses |
检测是否存在重复或不一致的 NTP 配置 | PowerStore:升级前运行状况检查 (PUHC) 识别重复的 NTP 条目 |
off_release_asymmetric_netdevice_check * |
检测非对称网络设备配置 | PowerStore:升级前运行状况检查 (PUHC) 以识别非对称 NetDevice 配置 |
user_db_fewer_records * |
在必要时检测受影响设备的节点之间的 user.db 条目是否丢失或不同 | PowerStore:升级前运行状况检查 (PUHC) 检测节点之间必要的 user.db 条目是丢失了还是条目不同 |
系统检查
图例:在本表中,符号 * 表示在此最新的运行状况检查精简软件包中引入/增强的检查。
表 2.PowerStore-health_check-4.4.0.0-2720358-retail.tgz.bin系统检查
| 测试名称 | 描述 | 知识库文章 |
|---|---|---|
four_port_iom_state_check |
检测 4PortCard 是否错误地设置为 fru_is_not_in_use | PowerStore:系统运行状况检查检测到 4PortCard 错误地设置为 fru_is_not_in_use |
indus_encryption_offset_check |
检测 NVMe 扩展柜的驱动器无效加密带位置 | PowerStore:系统检查检测到 ENS24 机柜的驱动器无效加密带位置 |
unfinished_ndu_check |
检测是否存在未完成的升级 | PowerStore:系统运行状况检查已检测到 NDU 提交失败的残留物 |
indus_drive_paths_check |
检测通往 ENS24 NVMe 扩展柜的不稳定路径 | PowerStore:系统运行状况检查检测通往 ENS24 NVMe 扩展柜的不稳定路径。 |
cpu_ierr_check |
检查 CPU 内部错误 | PowerStore:系统运行状况检查在 CPU IERR 检查中检测到问题 |
active_system_alert_check |
检测活跃的主要警报和严重警报 | PowerStore:运行状况检查检测到活跃的警报 |
cyc_node_space_check |
检测到节点的 /cyc_node 目录空间不足 | PowerStore:系统运行状况检查检测到 cyc_node 中空间不足 |
time_skew_check |
检测不受支持的大时间偏差 | PowerStore:运行状况检查在节点和 BMC 上检测到时间偏差较大 |
component_sn_check |
检测不一致的 BBU 或 PSU 序列号 | PowerStore:系统运行状况检查检测到组件序列号不一致:组件序列号检查 |
invalid_vg_uuid_check |
检测在控制路径 (CP) 中没有成员的卷组是否存在 | PowerStore:运行状况检查检测是否存在没有成员的卷组 |
kernel_slab_check |
检测是否有任何节点的层块分配超过 skbuff_fclone_cache 限制 | PowerStore:运行状况检查检测是否有任何节点的层块分配超过 skbuff_fclone_cache 限制 |
dp_mem_allocation_override_check |
检测到存在错误的数据路径 (DP) 内存设置 | PowerStore:系统运行状况检查检测到存在错误的数据路径内存设置 |
unsupported_drive_check |
检测到系统中存在 DriveDB.json v0.6.6.0 未涵盖的驱动器 | PowerStore 运行状况检查识别系统中存在 DriveDB.json v0.6.6.0 未涵盖的驱动器 |
适用于 4.0.x 和 4.1.x 的运行状况检查软件包
下表列出了 PowerStore-health_check-4.1.0.0-2665115-retail.tgz.bin 运行状况检查精简软件包。该软件包仅与 PowerStoreOS 4.0.x 和 4.1.x 版本兼容。
升级前运行状况检查 (PUHC)
图例:在本表中,符号 * 表示在此最新的运行状况检查精简软件包中引入或增强的检查。
表 3.PowerStore-health_check-4.1.0.0-2665115-retail.tgz.bin PUHC
| 测试名称 | 描述 | 知识库文章 |
|---|---|---|
off_release_duplicate_or_inconsistent_addresses * |
检测到重复的 NTP 条目 | PowerStore:升级前运行状况检查 (PUHC) 识别重复的 NTP 条目 |
off_release_drive_firmware_check_oe |
PUHC 可防止因磁盘固件升级期间出现问题而导致系统不稳定 | PowerStore:PUHC 可防止因磁盘固件升级期间出现问题而导致系统不稳定 |
off_release_volume_metro_reservation_mode_check |
检测是否有一个或多个 Metro 卷卡在同步(同步数据库)状态 | PowerStore:升级前运行状况检查 (PUHC) 检测到 4.0.X Metro 系统中 SYM Metro 卷卡在同步数据库状态 |
off_release_cpdb_locale_check |
检测 PowerStore 管理或本地数据库中的区域设置或编码设置是否正确 | PowerStore:CP 数据库服务器 (localdb/managementdb) 的数据库编码或区域设置未得到正确配置 |
off_release_dpe_drive_check |
检查具有 Indus 的 PowerStore500T 是否有足够的 DPE 驱动器 | PowerStore:升级前运行状况检查评估具有 NVMe 扩展柜 (ENS24) 的 PowerStore500T 是否有足够数量的 DPE 驱动器 |
off_release_check_iscsi_rep_block_size_failed |
检测是否有大小为 4096 字节的卷正在通过 iSCSI 协议进行复制 | PowerStore:升级前运行状况检查 (PUHC) 检测到卷扇区大小为 4096 的卷正在通过 iSCSI 协议进行复制 |
off_release_rba_configuration_check |
确定是否已配置 RBA 层 | PowerStore:升级前运行状况检查检测到已启用 RBA 层 |
iom_activation_check |
防止在未激活的情况下进行 IOM/SLIC 的 NDU | PowerStore:运行状况检查检测到未正确激活 IOPM V2 模块或以太网 SLIC |
PS Redundancy * |
检测非冗余电源 | PowerStore:升级前运行状况检查 (PUHC) 检测非冗余电源 |
SAS drives with firmware port locked |
检测锁定的固件端口 | PowerStore:针对 Samsung SAS 驱动器中锁定的固件端口的升级前运行状况检查 |
off_release_ssd_in_rg_check |
检测 SSD 是否不在 DRE 组中 | PowerStore:升级前运行状况检查检测到并非所有 SSD 都在 RAID 组中 |
scheduled_vm_snapshot |
检测是否有任何虚拟机计划快照正在进行中 | PowerStore:升级前运行状况检查 (PUHC) 检查所有快照命令是否都处于已完成状态 |
off_release_scsi3_reservation_check |
检查系统是否存在任何过时的 SCSI-3 保留 | PowerStore:升级前运行状况检查检测到过时的 SCSI-3 保留问题 |
off_release_ens24_drive_missing_path_check |
检查系统是否存在故障或缺失的非冗余 NVMe 驱动器路径 | PowerStore:升级前运行状况检查 (PUHC) 检测非冗余 NVMe 驱动器路径 |
pd_manifest_version_check |
PUHC 可确保 PowerStore 中 Rx-Definitions 软件包的兼容性和版本控制 | PowerStore:升级前运行状况检查 (PUHC),确保 PowerStore 中 Rx-Definitions 软件包的兼容性和版本控制 |
off_release_incomplete_commands_check |
PUHC 检测到未完成的控制路径 (CP) 命令,这些命令不在 NDU 期间允许执行的已批准列表中 | PowerStore:PUHC 检测到未完成的 CP 命令 — off_release_incomplete_commands_check |
unsupported_drive_check |
PUHC 检测到系统中存在 DriveDB.json v0.6.6.0 未涵盖的驱动器 | PowerStore:运行状况检查识别系统中存在 DriveDB.json v0.6.6.0 未涵盖的驱动器 |
nvram_full_fips_check |
PUHC 检测到 NVRAM 磁盘的完整 FIPS 设置不正确 | PowerStore:系统运行状况检查和/或升级前运行状况检查 3.x/4.x | 更换 NVMe NVRAM 磁盘可能会错误地引发 FIPS 警报 |
off_release_removed_third_party_certificate_check |
检测到缺少第三方证书链 | PowerStore:升级前运行状况检查 (PUHC) 检测到重置证书 REST 端点问题 |
系统检查
图例:在本表中,符号 * 表示在此最新的运行状况检查精简软件包中引入/增强的检查。
表 4.PowerStore-health_check-4.1.0.0-2665115-retail.tgz.bin系统检查
| 测试名称 | 描述 | 知识库文章 |
|---|---|---|
four_port_iom_state_check |
检测 4PortCard 是否错误地设置为 fru_is_not_in_use | PowerStore:系统运行状况检查检测到 4PortCard 错误地设置为 fru_is_not_in_use |
indus_encryption_offset_check |
检测 NVMe 扩展柜的驱动器无效加密带位置 | PowerStore:系统检查检测到 ENS24 机柜的驱动器无效加密带位置 |
unfinished_ndu_check |
检测是否存在未完成的升级 | PowerStore:系统运行状况检查已检测到 NDU 提交失败的残留物 |
indus_drive_paths_check |
检测通往 ENS24 NVMe 扩展柜的不稳定路径 | PowerStore:系统运行状况检查检测通往 ENS24 NVMe 扩展柜的不稳定路径。 |
cpu_ierr_check |
检查 CPU 内部错误 | PowerStore:系统运行状况检查在 CPU IERR 检查中检测到问题 |
active_system_alert_check |
检测活跃的主要警报和严重警报 | PowerStore:运行状况检查检测到活跃的警报 |
cyc_node_space_check |
检测到节点的 /cyc_node 目录空间不足 | PowerStore:系统运行状况检查检测到 cyc_node 中空间不足 |
time_skew_check |
检测不受支持的大时间偏差 | PowerStore:运行状况检查在节点和 BMC 上检测到时间偏差较大 |
component_sn_check |
检测不一致的 BBU 或 PSU 序列号 | PowerStore:系统运行状况检查检测到组件序列号不一致:组件序列号检查 |
component_stale_fw_check |
检测固件是否为最新版本以及是否与 Dell X.509 签名兼容 | PowerStore:系统运行状况检查检测是否需要固件升级 |
symmd_on_disk_check |
在磁盘上检测过时的 System Manager 磁盘元数据 (SYMMD) 数据 | PowerStore:系统运行状况检查在磁盘上检测过时的 System Manager 磁盘元数据 (SYMMD) 数据 |
invalid_vg_uuid_check |
检测在控制路径 (CP) 中没有成员的卷组是否存在 | PowerStore:运行状况检查检测是否存在没有成员的卷组 |
stale_scsi3_reservation_check |
检测是否存在任何过时的 SCSI-3 保留 | PowerStore:系统运行状况检查检测到过时的 SCSI3 保留问题 |
kernel_slab_check |
检测是否有任何节点的层块分配超过 skbuff_fclone_cache 限制 | PowerStore:运行状况检查检测是否有任何节点的层块分配超过 skbuff_fclone_cache 限制 |
dp_mem_allocation_override_check |
检测到存在错误的数据路径 (DP) 内存设置 | PowerStore:系统运行状况检查检测到存在错误的数据路径内存设置 |
nvme_tcp_dmc_protection_check |
检测运行 4.1.0.0 的设备是否需要跟进,以防止出现数据完整性问题 | 在具有 NVMe-TCP LUN 的 PowerStoreOS 4.1.0.0 群集上进行 PowerStore 运行状况检查以防止出现数据完整性问题 |
unsupported_drive_check |
检测到系统中存在 DriveDB.json v0.6.6.0 未涵盖的驱动器 | PowerStore 运行状况检查识别系统中存在 DriveDB.json v0.6.6.0 未涵盖的驱动器 |
nvram_full_fips_check |
检测到 NVRAM 磁盘的完整 FIPS 设置不正确 | PowerStore:系统运行状况检查和/或升级前运行状况检查 3.x/4.x | 更换 NVMe NVRAM 磁盘可能会错误地引发 FIPS 警报 |
适用于 3.x 的运行状况检查软件包。
下表列出了 PowerStore-health_check-3.6.1.5-2691230-retail.tgz.bin 运行状况检查精简软件包。此软件包与 PowerStoreOS 版本 3.0.x、3.2.x、3.5.x 和 3.6(包括 3.6.1)兼容。它与 2.x 或 4.x 不兼容。
运行状况检查软件包中包含由系统检查和升级前运行状况检查 (PUHC) 使用的两种验证。
升级前运行状况检查 (PUHC)
图例:在本表中,符号 * 表示在此最新的运行状况检查精简软件包中引入/增强的检查。
表 5。PowerStore-health_check-3.6.1.5-2691230-retail.tgz.bin PUHC
| 测试名称 | 描述 | 知识库文章 |
|---|---|---|
duplicate_or_inconsistent_ntp_addresses * |
检测到重复的 NTP 条目 | PowerStore:升级前运行状况检查 (PUHC) 识别重复的 NTP 条目 |
dimm_sn_check * |
检测 DIMM 序列号中的不一致情况 | PowerStore:系统运行状况检查检测到不一致的 DIMM 序列号 |
off_release_duplicate_or_inconsistent_addresses |
检测到重复的 NTP 条目 | PowerStore:升级前运行状况检查 (PUHC) 识别重复的 NTP 条目 |
off_release_missing_pg_hba_conf_template_check |
检测是否缺少 pg_hba 配置模板文件 | PowerStore:升级前运行状况检查 (PUHC) 检测到缺少数据库 pg_hba 配置模板文件 |
off_release_nvme_discovered_initiators_check |
检测未分配的 NVME_FC 启动器是否已分区并连接到 PowerStore 设备 | PowerStore:升级前运行状况检查识别没有相应主机的启动器 |
off_release_cp_db_location_check |
在多设备群集中,检测某些内部 PowerStore 组件是否由同一设备托管 | PowerStore:升级前运行状况检查 (PUHC),确认主控制路径 (CP) 和主数据库 (DB) 是否由同一设备托管 |
off_release_cpdb_locale_check |
检测 PowerStore 管理或本地数据库中的区域设置或编码设置是否正确 | PowerStore:CP 数据库服务器 (localdb/managementdb) 的数据库编码或区域设置未得到正确配置 |
off_release_check_ndu_pause_rule |
检测是否在源操作系统上启用了“NDU 暂停”功能,并验证目标操作系统是否也支持该功能(如果适用) | PowerStore:阻止对不受支持的内部版本进行无中断升级 (NDU) |
off_release_locked_drive_check |
检测驱动器是否处于锁定状态 | PowerStore:升级运行状况检查检测驱动器是否处于锁定状态 |
off_release_nvram_full_fips_mode |
检测 NVRAM 磁盘的完整 FIPS 配置是否设置正确 | PowerStore:系统运行状况检查和/或升级前运行状况检查 3.x/4.x | 更换 NVMe NVRAM 磁盘可能会错误地引发 FIPS 警报 |
off_release_unsupported_drive_check |
检测是否在系统 driveDB.json 文件中找到了所有已安装的驱动器 | PowerStore 运行状况检查识别系统中存在 DriveDB.json v0.6.6.0 未涵盖的驱动器 |
off_release_check_db_rep_mode_failed |
检测并阻止由 3 个或 4 个设备组成的群集升级到 PowerStoreOS 4.1 | PowerStore:在包含三个或更多设备的群集上升级到 PowerStoreOS 4.1 后,管理数据库复制可能仍处于异步模式 |
off_release_drive_wear_check |
确定是否存在耗损程度过高的驱动器 | PowerStore:升级前运行状况检查 (PUHC) 确定是否存在磨损程度过高的驱动器。 |
off_release_dpe_drive_check |
检查具有 Indus 的 PowerStore500T 是否有足够的 DPE 驱动器 | PowerStore:升级前运行状况检查评估具有 NVMe 扩展柜 (ENS24) 的 PowerStore500T 是否有足够的 DPE 驱动器。 |
off_release_drivedb_check |
检测错误的驱动器数据库文件 | PowerStore:升级前运行状况检查 (PUHC) 检测错误的驱动器数据库签名。 |
off_release_check_iscsi_rep_block_size_failed |
检测是否有大小为 4096 字节的卷正在通过 iSCSI 协议进行复制 | PowerStore:升级前运行状况检查 (PUHC) 检测到卷扇区大小为 4096 的卷正在通过 iSCSI 协议进行复制 |
efi_boot_check
|
检查是否使用了正确的启动项选项 | PowerStore:升级前运行状况检查检测重新启动是否使用了错误的启动项选项 |
off_release_rba_configuration_check |
确定是否已配置 RBA 层 | PowerStore:升级前运行状况检查检测是否已启用 RBA 层。 |
iom_activation_check |
防止在未激活的情况下进行 IOM/SLIC 的 NDU | PowerStore:运行状况检查检测到添加了 NVMe 扩展柜 (ENS24),但却无法识别它。 |
silent_drive_failure_check |
检测底层固件升级过程是否正在运行 | PowerStore:运行状况检查检测到缺少 SSD 的问题 |
off_release_check_proc_install_disk_firmware |
检测底层固件升级过程是否正在运行 | PowerStore:升级前运行状况检查检测到底层固件升级过程正在运行 |
off_release_ssd_in_rg_check |
检测 SSD 是否不在 DRE 组中 | PowerStore:升级前运行状况检查检测到并非所有 SSD 都在 RAID 组中 |
SAS drives with firmware port locked |
检测锁定的固件端口 | PowerStore:针对 Samsung SAS 驱动器中锁定的固件端口的升级前运行状况检查 |
PS Redundancy |
检测非冗余电源 | PowerStore:升级前运行状况检查 (PUHC) 检测非冗余电源 |
replication_session_state |
检测到复制会话正在进行中 | PowerStore:升级前运行状况检查 (PUHC) 检测到复制处于阻止 NDU 的状态。 |
scheduled_vm_snapshot |
检测是否有任何虚拟机计划快照正在进行中 | PowerStore:升级前运行状况检查 (PUHC) 检查所有快照命令是否都处于已完成状态。 |
off_release_check_chap_authentication |
off_release_check_chap_authentication | PowerStore:升级前运行状况检查 (PUHC) 检测是否正确配置 CHAP 转接连接。 |
The maintenance window is configured. |
检测是否已配置维护窗口。仅适用于系统不会在 NDU 之前自动启用维护窗口的操作系统版本 | PowerStore:升级前运行状况检查 (PUHC) 检测到尚未配置维护窗口 |
Detect a secondary IP issue. |
检测 NVMe 扩展柜上的辅助 IP 问题 | PowerStore:升级前运行状况检查 (PUHC) 检测到 ENS24 NVMe 扩展柜上的辅助 IP 设置存在问题。 |
SDNAS snapshot limit |
检测 SDNAS 快照是否超出其限制 | PowerStore:系统运行状况检查检测到已超出 SDNAS 快照限制 |
Duplicate FW entry check |
在节点的简历(注册表)中检测到重复的组件固件条目 | PowerStore:系统运行状况检查检测到重复的固件条目 |
Initiator connectivity check |
检测是否存在任何非冗余启动器 | PowerStore:系统运行状况检查检测到非冗余启动器 |
Reboot flag set |
检测是否设置了重新启动标记 | PowerStore:系统运行状况检查检测到已设置重新启动标记 |
Recovery partition image check |
在恢复分区中检测错误的文件名 | PowerStore:运行状况检查检测到文件名、恢复分区或 PowerStoreOS 软件包版本存在问题 |
off_release_sdnas_remote_network_alert_check |
检测到 NAS 复制接口不匹配 | PowerStore:升级前运行状况检查 (PUHC) 检测到 NAS 复制会话的接口不匹配 |
off_release_stale_scsi3_reg_check |
检查系统是否存在任何过时的 SCSI-3 保留 | PowerStore:升级前运行状况检查检测到过时的 SCSI-3 保留问题 |
empty_vg_no_memebers |
检测在控制路径 (CP) 中没有成员的卷组是否存在 | PowerStore:运行状况检查检测是否存在没有成员的卷组 |
off_release_ens24_drive_missing_path_check |
检查系统是否存在故障或缺失的非冗余 NVMe 驱动器路径 | PowerStore:升级前运行状况检查 (PUHC) 检测非冗余 NVMe 驱动器路径 |
off_release_scsi3_reservation_check |
检查系统是否存在任何现有的 SCSI-3 保留 | PowerStore:升级前运行状况检查检测现有的 SCSI3 保留 |
off_release_sdnas_last_event_id_check |
检测 SdnasLastProcessedEventId 编号是否大到足以导致内存不足问题 | PowerStore:升级前运行状况检查 (PUHC) 检测 SdnasLastProcessedEventId 编号是否大到足以导致内存不足问题。 |
off_release_new_firmware_zip_existence_check |
检测丢失的预暂存固件 .zip 文件问题,以防止 NDU 失败 | PowerStore:升级前运行状况检查 (PUHC) 检测“新的固件 zip 是否已从固件分区阶段抹除” |
off_release_sdnas_memory_config |
检测平台对 NAS 容器的限制与 NAS 尝试在内部分配的限制之间是否存在不匹配 | PowerStore:升级前运行状况检查 (PUHC) 检测到 SDNAS 内存配置问题 |
off_release_nvme_reservation_check |
检测群集上是否存在 NVMe 保留 | PowerStore:升级前运行状况检查 (PUHC) 检测群集上是否存在 NVMe 保留 |
off_release_dp_mem_override_file_exists |
检测是否存在现有的数据路径 (DP) 内存覆盖文件 | PowerStore:升级前运行状况检查 (PUHC) 检测到数据路径内存的 OOM 覆盖 |
off_release_removed_third_party_certificate_check |
检测到缺少第三方证书链 | PowerStore:升级前运行状况检查 (PUHC) 检测到重置证书 REST 端点问题 |
user_db_fewer_records |
在必要时检测受影响设备的节点之间的 user.db 条目是否丢失或不同 | PowerStore:升级前运行状况检查 (PUHC) 检测节点之间必要的 user.db 条目是丢失了还是条目不同 |
off_release_vol_in_destroying_state_check |
检测卷是否处于“正在销毁”状态 | PowerStore:升级前运行状况检查 (PUHC) 检测到处于“正在销毁”状态的卷 |
off_release_incomplete_commands_check |
检测到未完成的控制路径 (CP) 命令,这些命令不在 NDU 期间允许执行的已批准列表中 | PowerStore:PUHC 检测到未完成的 CP 命令 — off_release_incomplete_commands_check |
off_release_inter_cluster_tcp_conn_check |
检测到部分群集间 TCP 连接 | PowerStore:升级前运行状况检查 (PUHC) 检测到部分群集间 TCP 连接 |
off_release_stale_gsips_in_remote_rtps_check |
检测到远程相对目标端口 (RTP) 中遗留的任何不存在的全局存储发现 IP (GSIP) | PowerStore:升级前运行状况检查检测到远程 RTP 中的过时 GSIP |
系统检查
图例:在本表中,符号 * 表示在此最新的运行状况检查精简软件包中引入/增强的检查。
表 6。PowerStore-health_check-3.6.1.5-2691230-retail.tgz.bin系统检查
| 测试名称 | 描述 | 知识库文章 |
|---|---|---|
off_release_nvram_full_fips_mode |
检测 NVRAM 磁盘的完整 FIPS 配置是否设置正确 | PowerStore:系统运行状况检查和/或升级前运行状况检查 3.x/4.x | 更换 NVMe NVRAM 磁盘可能会错误地引发 FIPS 警报 |
off_release_unsupported_drive_check |
检测是否在系统 driveDB.json 文件中找到了所有已安装的驱动器 | PowerStore 运行状况检查识别系统中存在 DriveDB.json v0.6.6.0 未涵盖的驱动器 |
ppds_dsb_check |
检测过时的 DSB 信息 | PowerStore:系统检查检测到平台数据服务信息已过时。 |
indus_encryption_offset_check |
检测 NVMe 扩展柜的驱动器无效加密带位置 | PowerStore:系统检查检测 NVMe 扩展柜 (ENS24) 的驱动器无效加密带位置。 |
dp_dedupe_destage_leak_check |
检测导致驱动器过度磨损的不必要降级 | PowerStore:系统检查检测到不必要的降级 |
kr_link_boot_option_check |
检测 500T 设备的两个节点上是否未启用 KR 链路 PXE 启动选项 | PowerStore:系统检查检测 PowerStore 500T 设备的两个节点上是否未启用 KR 链路 PXE 启动选项。 |
iom_activation_check |
防止在未激活的情况下进行 IOM/SLIC 的 NDU | PowerStore:运行状况检查检测到添加了 NVMe 扩展柜 (ENS24),但却无法识别它。 |
dp_resiliency_mode_check |
检测弹性模式的非正常退出(vDisk 问题) | PowerStore:系统检查检测到设备不必要地保持在弹性模式下。 |
sdnas_capacity_alert_check |
检测升级后是否禁用了文件系统容量警报 | PowerStore:升级后禁用文件系统使用容量警报。 |
unfinished_ndu_check |
检测是否存在未完成的升级 | PowerStore:系统运行状况检查检测到 NDU 提交失败的残留物。 |
silent_drive_failure_check |
检测知识库文章 000216381 中的 PowerStore 问题:SSD 发生故障且未显示警报 | PowerStore:运行状况检查检测缺少 SSD 的问题。 |
target_port_group_id_check |
检测影响 NVMeoF 卷映射的目标端口组问题 | PowerStore:系统运行状况检查检测到可能影响 NVMeoF 卷映射的目标端口组问题。 |
indus_drive_paths_check |
检测通往 ENS24 NVMe 扩展柜的不稳定路径 | PowerStore:系统运行状况检查检测通往 ENS24 NVMe 扩展柜的不稳定路径。 |
dimm_sn_check |
检测 DIMM 序列号中的不一致情况 | PowerStore:系统运行状况检查检测到不一致的 DIMM 序列号。 |
recovery_partition_image_check |
在恢复分区中检测错误的文件名 | PowerStore:系统运行状况检查检测恢复分区中是否有错误的文件名。 |
duplicate_fw_entry_check |
在节点的简历(注册表)中检测到重复的组件固件条目 | PowerStore:系统运行状况检查检测到重复的固件条目。 |
cpu_ierr_check |
检查 CPU 内部错误 | PowerStore:系统运行状况检查在 CPU IERR 检查中检测到问题。 |
InitiatorConnectivityCheck |
检测非冗余启动器 | PowerStore:系统运行状况检查检测到非冗余启动器。 |
icd_network_check |
检测到缺少与 ToR 的连接 | PowerStore:系统运行状况检查检测到 ICD 网络连接问题。 |
dimm_correctable_error_check |
检测 DIMM 可纠正错误 (CE) 数(5k 阈值) | PowerStore:系统运行状况检查检测到过多的 DIMM 可纠正错误 (CE) 数。 |
active_system_alert_check |
检测活跃的主要警报和严重警报 | PowerStore:运行状况检查检测到活跃的警报。 |
cyc_node_space_check |
检测到节点的 /cyc_node 目录空间不足 | PowerStore:系统运行状况检查检测到 /cyc_node 中的空间不足。 |
time_skew_check |
检测不受支持的大时间偏差 | PowerStore:系统运行状况检查在节点和 BMC 上检测到时间偏差较大。 |
db_tmpfiles_check |
检测数据库临时文件是否大于预期 | PowerStore:系统运行状况检查检测到大型数据库临时文件。 |
bbu_sensor_check |
在各种 BBU 运行状况检查中检测故障 | PowerStore:系统运行状况检查检测到无效的电池状态。 |
component_sn_check |
检测不一致的 BBU 或 PSU 序列号 | PowerStore:系统运行状况检查检测到组件序列号不一致:fru_items_sn_check |
fsck_leftover_check |
检测是否存在 fsck 生成的文件 cyc-sys-mode-override.txt | PowerStore:系统运行状况检查检测到恢复文件。 |
component_stale_fw_check |
检测固件是否为最新版本以及是否与 Dell X.509 签名兼容 | PowerStore:系统运行状况检查检测是否需要固件升级。 |
transit_connection_check |
检测数据路径中是否存在转接连接对象 | PowerStore:系统检查检测到孤立的转接连接对象 |
symmd_on_disk_check |
检测磁盘上是否保存了最新的 System Manager 磁盘元数据 (SYMMD) 数据 | PowerStore:系统运行状况检查在磁盘上检测过时的 System Manager 磁盘元数据 (SYMMD) 数据 |
kernel_slab_check |
检测是否有任何节点的层块分配超过 skbuff_fclone_cache 限制 | PowerStore:系统运行状况检查检测是否有任何节点的层块分配超过 skbuff_fclone_cache 限制 |
适用于 2.1.x 的运行状况检查软件包。
下表列出了 PowerStore-health_check-2.1.1.2-2069723-retail.tgz.bin 运行状况检查精简软件包。此软件包与 PowerStoreOS 版本 2.1.x 兼容。它与 3.x 或 4.x 版本不兼容。
表 7。PowerStore-health_check-2.1.1.2-2069723-retail.tgz.bin运行状况检查
| 测试名称 | 描述 | 故障知识库文章 |
|---|---|---|
mtc_drive_counter_check |
检测 MTC NVRAM 驱动器问题 | PowerStore:系统运行状况检查检测 MTC NVRAM 驱动器问题。 |
drive_flags_check |
检测脱机和故障的驱动器,其中包括不发出警报的驱动器 | PowerStore:系统运行状况检查检测脱机或故障的 SSD。 |
bbu_sensor_check |
在各种 BBU 运行状况检查中检测故障 | PowerStore:系统运行状况检查检测到无效的电池状态。 |
kms_lockbox_file_check |
检测 dare 密码箱的问题 | PowerStore:运行状况检查检测到密码箱存在问题。 |
os_package_name_check |
在恢复分区中检测错误的文件名 | PowerStore:运行状况检查检测到文件名、恢复分区或 PowerStoreOS 软件包版本存在问题。 |
duplicate_fw_entry_check |
在节点的简历(注册表)中检测重复的组件固件条目。 | PowerStore:系统运行状况检查检测到重复的固件条目。 |
fsck_leftover_check |
检测意外的恢复文件 | PowerStore:系统运行状况检查检测到恢复文件。 |
recovery_partition_image_check |
在恢复分区中检测错误的文件名 | PowerStore:系统运行状况检查检测恢复分区中是否有错误的文件名。 |
symmetric_icm_connection |
检测缺少的 ICM 连接 | PowerStore:运行状况检查软件包针对非对称 ICM 连接的检查失败 |
cpu_ierr_check |
检查 CPU 内部错误 | PowerStore:系统运行状况检查在 CPU IERR 检查中检测到问题。 |
InitiatorConnectivityCheck |
检测非冗余启动器 | PowerStore:系统运行状况检查检测到非冗余启动器。 |
icd_network_check |
检测到缺少与 ToR 的连接 | PowerStore:系统运行状况检查检测到 ICD 网络连接问题。 |
symmd_fw_upgrade_flag_check |
检测处于无效状态的 PSU | PowerStore:系统运行状况检查检测到错误的 PSU 状态。 |
dimm_correctable_error_check |
检测 DIMM CE 数(5k 阈值) | PowerStore:系统运行状况检查检测到过多的 DIMM 可纠正错误 (CE) 数。 |
active_system_alert_check |
检测活跃的主要警报和严重警报 | PowerStore:运行状况检查检测到活跃的警报。 |
cyc_node_space_check |
检测到节点的 /cyc_node 目录空间不足 | PowerStore:系统运行状况检查检测到 /cyc_node 中的空间不足。 |
time_skew_check |
检测不受支持的大时间偏差 | PowerStore:系统运行状况检查在节点和 BMC 上检测到时间偏差较大。 |
db_tmpfiles_check |
检测数据库临时文件是否大于预期 | PowerStore:系统运行状况检查检测到大型数据库临时文件。 |
bbu_ipmi_i2c_check |
在各种 BBU 运行状况检查中检测故障 | PowerStore:系统运行状况检查检测到无效的电池状态。 |
ru_items_sn_check |
检测不一致的 BBU 或 PSU 序列号 | PowerStore:系统运行状况检查检测到组件序列号不一致:fru_items_sn_check |