PowerStore:市售版本 (非目前版本) 系統健全狀況檢查的登陸頁面
摘要: PowerStoreOS 發佈後,偶爾應新增健全狀況檢查。這些健全狀況檢查是由精簡型套裝機制提供,可識別 PowerStore 叢集中的各種已知問題。
說明
背景
有時在 PowerStoreOS 發佈後會發現作業系統內建健全狀況檢查和警示功能未偵測到的新問題。健全狀況檢查精簡型套裝功能可用來為已安裝的 PowerStoreOS 提供新的健全狀況檢查。
健全狀況檢查套裝包含在不中斷升級 (NDU) 之前執行的健全狀況檢查。此套裝也包括一般系統健全狀況檢查項目,可在需要時從 PowerStore Manager 叫用執行 (監控 > 系統檢查 > 執行系統檢查)。
健全狀況檢查套裝必須先上傳至 PowerStore 叢集,然後再安裝。
如需安裝和使用健全狀況檢查套裝的詳細指示,請參閱下列 KB 文章之一:
- KB 192601 PowerStore:如何使用升級前執行狀況檢查和系統檢查,在軟體升級前檢查叢集的執行狀況
- KB 198084 PowerStore:如何使用系統檢查功能。
目錄
4.2.x、4.3.x 和 4.4.x 的健全狀況檢查套裝。
下表列出執行狀況檢查中的 PowerStore-health_check-4.4.0.0-2720358-retail.tgz.bin 健全狀況檢查薄型套件。此套件僅相容於 PowerStoreOS 版本 4.2.x、4.3.x 和 4.4.x。
請參閱 PowerStore:RxDefinitions 問題登陸頁面,以取得此套裝所含測試項目的相關資訊。
升級前健全狀況檢查 (PUHC)
圖例:在此表格中,符號 * 表示此為最新版健全狀況檢查精簡型套裝中新引進或經強化的檢查項目。
表 1.PowerStore-health_check-4.4.0.0-2720358-retail.tgz.bin執行狀況檢查
| 測試名稱 | 說明 | KB 文章 |
|---|---|---|
PS Redundancy |
偵測非備援電源供應 | PowerStore:升級前健全狀況檢查 (PUHC) 可偵測非備援電源供應 |
scheduled_vm_snapshot |
偵測是否有任何 VM 已排程的快照正在執行中 | PowerStore:升級前健全狀況檢查 (PUHC) 會檢查所有快照命令是否都處於完成狀態。 |
ens24_drive_missing_path_check |
檢查系統是否有故障或遺失的非備援 NVMe 磁碟機路徑 | PowerStore:預先升級健全狀況檢查 (PUHC),以偵測非備援 NVMe 磁碟機路徑 |
incomplete_commands_check |
PUHC 可偵測在 NDU 期間,不屬於核准命令清單內且不完整的控制路徑 (CP) 命令 | PowerStore:升級前健全狀況檢查 (PUHC) 可偵測不完整的 CP 命令 |
unsupported_drive_check |
PUHC 可偵測系統中是否存在 DriveDB.json v0.6.6.0 未涵蓋的磁碟機 | PowerStore 健全狀況檢查可識別系統中是否存在 DriveDB.json v0.6.6.0 未涵蓋的磁碟機 |
nvram_full_fips_check |
偵測到 NVRAM 磁碟的完整 FIPS 設定不正確 | PowerStore:系統健全狀況檢查和/或升級前健全狀況檢查 3.x/4.x | 更換 NVMe NVRAM 磁碟可能會誤發 FIPS 警示 |
kernel_slab_check |
偵測是否有任何節點的 Slab 分配超過 skbuff_fclone_cache 限制 | PowerStore:健全狀況檢查可偵測是否有任何節點的 Slab 分配超過 skbuff_fclone_cache 限制 |
duplicate_or_inconsistent_ntp_addresses |
偵測重複或不一致的 NTP 組態 | PowerStore:升級前健全狀況檢查 (PUHC) 可識別重複的 NTP 項目 |
off_release_asymmetric_netdevice_check * |
偵測非對稱網路裝置組態 | PowerStore:升級前執行狀況檢查 (PUHC),以識別非對稱網路裝置組態 |
user_db_fewer_records * |
偵測受影響裝置的節點之間,必要的 user.db 項目是否遺失或有差異 | PowerStore:升級前健全狀況檢查 (PUHC) 可偵測各節點之間的必要 user.db 項目是否遺失或有差異 |
系統檢查
圖例:在此表格中,符號 * 表示此為最新版健全狀況檢查精簡型套裝中新引進/經強化的檢查項目。
表 2.PowerStore-health_check-4.4.0.0-2720358-retail.tgz.bin系統檢查
| 測試名稱 | 說明 | KB 文章 |
|---|---|---|
four_port_iom_state_check |
偵測 4PortCard 是否誤設為 fru_is_not_in_use | PowerStore:系統健全狀況檢查可偵測 4PortCard 是否誤設為 fru_is_not_in_use |
indus_encryption_offset_check |
偵測 NVMe 擴充機櫃的磁碟機是否存在無效的加密頻段位置 | PowerStore:系統檢查可偵測 ENS24 機櫃的磁碟機是否存在無效的加密頻段位置 |
unfinished_ndu_check |
偵測是否存在未完成的升級作業 | PowerStore:系統健全狀況檢查偵測到失敗的 NDU 提交作業殘留 |
indus_drive_paths_check |
偵測 ENS24 NVMe 擴充機櫃不穩定的路徑 | PowerStore:系統健全狀況檢查可偵測不穩定的 ENS24 NVMe 擴充機櫃路徑。 |
cpu_ierr_check |
檢查是否有 CPU 內部錯誤 | PowerStore:系統健全狀況檢查可偵測 CPU IERR 檢查發生問題 |
active_system_alert_check |
偵測作用中重大和關鍵警示 | PowerStore:健全狀況檢查偵測到有作用中的警示 |
cyc_node_space_check |
偵測節點的 /cyc_node 目錄空間不足 | PowerStore:系統健全狀況檢查偵測 cyc_node 中的空間不足 |
time_skew_check |
偵測不受支援的大時間偏差 | PowerStore:健全狀況檢查可偵測節點和 BMC 上的時間偏差過高 |
component_sn_check |
偵測 BBU 或 PSU 的序號不一致 | PowerStore:系統健全狀況檢查可偵測元件序號不一致:元件 SN 檢查 |
invalid_vg_uuid_check |
偵測是否存在控制路徑 (CP) 中沒有成員的磁碟區群組 | PowerStore:健全狀況檢查可偵測是否存在無成員的磁碟區群組 |
kernel_slab_check |
偵測是否有任何節點的 Slab 分配超過 skbuff_fclone_cache 限制 | PowerStore:健全狀況檢查可偵測是否有任何節點的 Slab 分配超過 skbuff_fclone_cache 限制 |
dp_mem_allocation_override_check |
偵測錯誤的資料路徑 (DP) 記憶體設定 | PowerStore:系統健全狀況檢查可偵測錯誤的資料路徑記憶體設定 |
unsupported_drive_check |
偵測系統中是否存在 DriveDB.json v0.6.6.0 未涵蓋的磁碟機 | PowerStore 健全狀況檢查可識別系統中是否存在 DriveDB.json v0.6.6.0 未涵蓋的磁碟機 |
4.0.x 和 4.1.x 的健全狀況檢查套裝
下表列出執行狀況檢查中的 PowerStore-health_check-4.1.0.0-2665115-retail.tgz.bin 健全狀況檢查薄型套件。此套裝僅相容於 PowerStoreOS 版本 4.0.x 和 4.1.x。
升級前健全狀況檢查 (PUHC)
圖例:在此表格中,符號 * 表示此為最新版健全狀況檢查精簡型套裝中新引進或經強化的檢查項目。
表 3.PowerStore-health_check-4.1.0.0-2665115-retail.tgz.bin PUHC
| 測試名稱 | 說明 | KB 文章 |
|---|---|---|
off_release_duplicate_or_inconsistent_addresses * |
偵測重複的 NTP 項目 | PowerStore:升級前健全狀況檢查 (PUHC) 可識別重複的 NTP 項目 |
off_release_drive_firmware_check_oe |
PUHC 可防止因磁碟韌體升級期間的問題而導致系統不穩 | PowerStore:PUHC 可防止因磁碟韌體升級期間的問題而導致系統不穩 |
off_release_volume_metro_reservation_mode_check |
偵測一或多個 Metro 磁碟區是否卡在同步 (同步 DB) 狀態 | PowerStore:升級前健全狀況檢查 (PUHC) 可偵測 4.0.X Metro 系統是否有 SYM Metro 磁碟區卡在同步 DB 狀態 |
off_release_cpdb_locale_check |
偵測 PowerStore 管理或本機資料庫中的地區設定或編碼設定是否正確 | PowerStore:CP 資料庫伺服器 (localdb/managementdb) 的資料庫編碼或地區設定設定有誤 |
off_release_dpe_drive_check |
檢查搭載 Indus 的 PowerStore500T 是否有足夠的 DPE 磁碟機 | PowerStore:升級前健全狀況檢查可評估配備 NVMe 擴充機櫃 (ENS24) 的 PowerStore500T 是否有足夠數量的 DPE 磁碟機 |
off_release_check_iscsi_rep_block_size_failed |
偵測是否有透過 iSCSI 通訊協定複寫的 4096 位元組大小磁碟區 | PowerStore:升級前健全狀況檢查 (PUHC) 可偵測透過 iSCSI 通訊協定複寫的 4096 扇區大小磁碟區 |
off_release_rba_configuration_check |
判定是否設定 RBA 層 | PowerStore:升級前健全狀況檢查可偵測是否啟用 RBA 層 |
iom_activation_check |
防止在未啟用情況下對 IOM/SLIC 進行 NDU | PowerStore:健全狀況檢查可偵測 IOPM V2 模組或乙太網路 SLIC 未正確啟用 |
PS Redundancy * |
偵測非備援電源供應 | PowerStore:升級前健全狀況檢查 (PUHC) 可偵測非備援電源供應 |
SAS drives with firmware port locked |
偵測已鎖定韌體連接埠 | PowerStore:升級前健全狀況檢查可偵測 Samsung SAS 磁碟機中已鎖定的韌體連接埠 |
off_release_ssd_in_rg_check |
偵測是否 SSD 未納入 DRE 群組 | PowerStore:升級前健全狀況檢查可偵測並非所有 SSD 均納入 RAID 群組 |
scheduled_vm_snapshot |
偵測是否有任何 VM 已排程的快照正在執行中 | PowerStore:升級前健全狀況檢查 (PUHC) 會檢查所有快照命令是否都處於完成狀態 |
off_release_scsi3_reservation_check |
檢查系統是否有任何過時的 SCSI-3 保留 | PowerStore:升級前健全狀況檢查可偵測過時的 SCSI-3 保留問題 |
off_release_ens24_drive_missing_path_check |
檢查系統是否有故障或遺失的非備援 NVMe 磁碟機路徑 | PowerStore:預先升級健全狀況檢查 (PUHC),以偵測非備援 NVMe 磁碟機路徑 |
pd_manifest_version_check |
PUHC 可確保 PowerStore 中 Rx-Definitions 套裝的相容性和版本控制 | PowerStore:升級前健全狀況檢查 (PUHC) 可確保 PowerStore 中 Rx-Definitions 套裝的相容性和版本控制 |
off_release_incomplete_commands_check |
PUHC 可偵測在 NDU 期間,不屬於核准命令清單內且不完整的控制路徑 (CP) 命令 | PowerStore:PUHC 可偵測不完整的 CP 命令 - off_release_incomplete_commands_check |
unsupported_drive_check |
PUHC 可偵測系統中是否存在 DriveDB.json v0.6.6.0 未涵蓋的磁碟機 | PowerStore:健全狀況檢查可識別系統中是否存在 DriveDB.json v0.6.6.0 未涵蓋的磁碟機 |
nvram_full_fips_check |
PUHC 可偵測出 NVRAM 磁碟的完整 FIPS 設定有誤 | PowerStore:系統健全狀況檢查和/或升級前健全狀況檢查 3.x/4.x | 更換 NVMe NVRAM 磁碟可能會誤發 FIPS 警示 |
off_release_removed_third_party_certificate_check |
偵測缺少的第三方憑證鏈結 | PowerStore:升級前健全狀況檢查 (PUHC) 可偵測 reset_certificates REST 端點問題 |
系統檢查
圖例:在此表格中,符號 * 表示此為最新版健全狀況檢查精簡型套裝中新引進/經強化的檢查項目。
表 4.PowerStore-health_check-4.1.0.0-2665115-retail.tgz.bin系統檢查
| 測試名稱 | 說明 | KB 文章 |
|---|---|---|
four_port_iom_state_check |
偵測 4PortCard 是否誤設為 fru_is_not_in_use | PowerStore:系統健全狀況檢查可偵測 4PortCard 是否誤設為 fru_is_not_in_use |
indus_encryption_offset_check |
偵測 NVMe 擴充機櫃的磁碟機是否存在無效的加密頻段位置 | PowerStore:系統檢查可偵測 ENS24 機櫃的磁碟機是否存在無效的加密頻段位置 |
unfinished_ndu_check |
偵測是否存在未完成的升級作業 | PowerStore:系統健全狀況檢查偵測到失敗的 NDU 提交作業殘留 |
indus_drive_paths_check |
偵測 ENS24 NVMe 擴充機櫃不穩定的路徑 | PowerStore:系統健全狀況檢查可偵測不穩定的 ENS24 NVMe 擴充機櫃路徑。 |
cpu_ierr_check |
檢查是否有 CPU 內部錯誤 | PowerStore:系統健全狀況檢查可偵測 CPU IERR 檢查發生問題 |
active_system_alert_check |
偵測作用中重大和關鍵警示 | PowerStore:健全狀況檢查偵測到有作用中的警示 |
cyc_node_space_check |
偵測節點的 /cyc_node 目錄空間不足 | PowerStore:系統健全狀況檢查偵測 cyc_node 中的空間不足 |
time_skew_check |
偵測不受支援的大時間偏差 | PowerStore:健全狀況檢查可偵測節點和 BMC 上的時間偏差過高 |
component_sn_check |
偵測 BBU 或 PSU 的序號不一致 | PowerStore:系統健全狀況檢查可偵測元件序號不一致:元件 SN 檢查 |
component_stale_fw_check |
偵測韌體是否為最新狀態,以及是否與 Dell X.509 簽章相容 | PowerStore:系統健全狀況檢查偵測是否需要進行韌體升級 |
symmd_on_disk_check |
偵測磁碟上過時的 System Manager Metadata on Disk (SYMMD) 資料 | PowerStore:系統健全狀況檢查可偵測磁碟上過時的 System Manager Metadata on Disk (SYMMD) 資料 |
invalid_vg_uuid_check |
偵測是否存在控制路徑 (CP) 中沒有成員的磁碟區群組 | PowerStore:健全狀況檢查可偵測是否存在無成員的磁碟區群組 |
stale_scsi3_reservation_check |
偵測任何過時的 SCSI-3 保留 | PowerStore:系統健全狀況檢查可偵測過時的 SCSI3 保留問題 |
kernel_slab_check |
偵測是否有任何節點的 Slab 分配超過 skbuff_fclone_cache 限制 | PowerStore:健全狀況檢查可偵測是否有任何節點的 Slab 分配超過 skbuff_fclone_cache 限制 |
dp_mem_allocation_override_check |
偵測錯誤的資料路徑 (DP) 記憶體設定 | PowerStore:系統健全狀況檢查可偵測錯誤的資料路徑記憶體設定 |
nvme_tcp_dmc_protection_check |
偵測執行 4.1.0.0 的裝置是否可能需要後續追蹤,以防止潛在的資料完整性問題 | 在使用 NVMe-TCP LUN 的 PowerStoreOS 4.1.0.0 叢集上,PowerStore 健全狀況檢查可防止資料完整性問題 |
unsupported_drive_check |
偵測系統中是否存在 DriveDB.json v0.6.6.0 未涵蓋的磁碟機 | PowerStore 健全狀況檢查可識別系統中是否存在 DriveDB.json v0.6.6.0 未涵蓋的磁碟機 |
nvram_full_fips_check |
偵測 NVRAM 磁碟的完整 FIPS 設定有誤 | PowerStore:系統健全狀況檢查和/或升級前健全狀況檢查 3.x/4.x | 更換 NVMe NVRAM 磁碟可能會誤發 FIPS 警示 |
3.x 的健全狀況檢查套裝。
下表列出執行狀況檢查中的 PowerStore-health_check-3.6.1.5-2691230-retail.tgz.bin 健全狀況檢查薄型套件。此套件相容於 PowerStoreOS 3.0.x、3.2.x、3.5.x 及 3.6 版 (包括 3.6.1)。它與 2.x 或 4.x 不相容。
健全狀況檢查套裝包含系統檢查和升級前健全狀況檢查 (PUHC) 所使用的兩項驗證。
升級前健全狀況檢查 (PUHC)
圖例:在此表格中,符號 * 表示此為最新版健全狀況檢查精簡型套裝中新引進/經強化的檢查項目。
表 5.PowerStore-health_check-3.6.1.5-2691230-retail.tgz.bin PUHC
| 測試名稱 | 說明 | KB 文章 |
|---|---|---|
duplicate_or_inconsistent_ntp_addresses * |
偵測重複的 NTP 項目 | PowerStore:升級前健全狀況檢查 (PUHC) 可識別重複的 NTP 項目 |
dimm_sn_check * |
偵測 DIMM 序號不一致 | PowerStore:系統健全狀況檢查可偵測 DIMM 序號不一致 |
off_release_duplicate_or_inconsistent_addresses |
偵測重複的 NTP 項目 | PowerStore:升級前健全狀況檢查 (PUHC) 可識別重複的 NTP 項目 |
off_release_missing_pg_hba_conf_template_check |
偵測是否缺少 pg_hba 組態範本檔案 | PowerStore:升級前健全狀況檢查 (PUHC) 可偵測缺少的資料庫 pg_hba 組態範本檔案 |
off_release_nvme_discovered_initiators_check |
偵測未指派的 NVME_FC 啟動器是否已設定分區,並已連線至 PowerStore Appliance | PowerStore:升級前健全狀況檢查可識別沒有對應主機的啟動器 |
off_release_cp_db_location_check |
在多裝置的叢集中,偵測部分內部 PowerStore 元件是否由同一裝置承載 | PowerStore:升級前健全狀況檢查 (PUHC) 可確認主要控制路徑 (CP) 和主要資料庫 (DB) 由相同裝置承載 |
off_release_cpdb_locale_check |
偵測 PowerStore 管理或本機資料庫中的地區設定或編碼設定是否正確 | PowerStore:CP 資料庫伺服器 (localdb/managementdb) 的資料庫編碼或地區設定設定有誤 |
off_release_check_ndu_pause_rule |
偵測來源 OS 上是否啟用「NDU 暫停」功能,並驗證目的地 OS 是否也支援此功能 (若適用) | PowerStore:封鎖不中斷升級 (NDU) 至不支援的建置版本 |
off_release_locked_drive_check |
偵測磁碟機是否處於鎖定狀態 | PowerStore:升級前健全狀況檢查可偵測磁碟機是否鎖定 |
off_release_nvram_full_fips_mode |
偵測 NVRAM 磁碟的完整 FIPS 組態是否設定正確 | PowerStore:系統健全狀況檢查和/或升級前健全狀況檢查 3.x/4.x | 更換 NVMe NVRAM 磁碟可能會誤發 FIPS 警示 |
off_release_unsupported_drive_check |
偵測是否能在系統 driveDB.json 檔案中找到所有已安裝的磁碟機 | PowerStore 健全狀況檢查可識別系統中是否存在 DriveDB.json v0.6.6.0 未涵蓋的磁碟機 |
off_release_check_db_rep_mode_failed |
偵測並阻止包含 3 或 4 個裝置的叢集升級至 PowerStoreOS 4.1 | PowerStore:在包含三個 (含) 以上裝置的叢集升級至 PowerStoreOS 4.1 後,管理資料庫複寫可能仍停留在非同步模式 |
off_release_drive_wear_check |
判定是否有磁碟機的耗損程度過高 | PowerStore:升級前健全狀況檢查 (PUHC) 會判斷是否有磁碟機的耗損程度過高。 |
off_release_dpe_drive_check |
檢查搭載 Indus 的 PowerStore500T 是否有足夠的 DPE 磁碟機 | PowerStore:升級前健全狀況檢查可評估配備 NVMe 擴充機櫃 (ENS24) 的 PowerStore500T 是否有足夠的 DPE 磁碟機。 |
off_release_drivedb_check |
偵測不正確的磁碟機資料庫檔案 | PowerStore:升級前健全狀況檢查 (PUHC) 可偵測不正確的磁碟機資料庫簽章。 |
off_release_check_iscsi_rep_block_size_failed |
偵測是否有透過 iSCSI 通訊協定複寫的 4096 位元組大小磁碟區 | PowerStore:升級前健全狀況檢查 (PUHC) 可偵測透過 iSCSI 通訊協定複寫的 4096 扇區大小磁碟區 |
efi_boot_check
|
檢查是否使用正確的開機項目選項 | PowerStore:升級前健全狀況檢查可偵測重開機是否使用錯誤的開機項目選項 |
off_release_rba_configuration_check |
判定是否設定 RBA 層 | PowerStore:進行升級前健全狀況檢查,以偵測是否已啟用 RBA 層級。 |
iom_activation_check |
防止在未啟用情況下對 IOM/SLIC 進行 NDU | PowerStore:健全狀況檢查偵測到已新增但無法識別的 NVMe 擴充機櫃 (ENS24)。 |
silent_drive_failure_check |
偵測基礎韌體升級程序是否正在執行中 | PowerStore:健全狀況檢查可偵測缺少 SSD 的問題 |
off_release_check_proc_install_disk_firmware |
偵測基礎韌體升級程序是否正在執行中 | PowerStore:升級前健全狀況檢查可偵測基礎韌體升級程序正在執行中 |
off_release_ssd_in_rg_check |
偵測是否 SSD 未納入 DRE 群組 | PowerStore:升級前健全狀況檢查可偵測並非所有 SSD 均納入 RAID 群組 |
SAS drives with firmware port locked |
偵測已鎖定韌體連接埠 | PowerStore:升級前健全狀況檢查可偵測 Samsung SAS 磁碟機中已鎖定的韌體連接埠 |
PS Redundancy |
偵測非備援電源供應 | PowerStore:升級前健全狀況檢查 (PUHC) 可偵測非備援電源供應 |
replication_session_state |
偵測複寫工作階段正在執行中 | PowerStore:升級前健全狀況檢查 (PUHC) 可偵測複寫處於防止 NDU 的狀態。 |
scheduled_vm_snapshot |
偵測是否有任何 VM 已排程的快照正在執行中 | PowerStore:升級前健全狀況檢查 (PUHC) 會檢查所有快照命令是否都處於完成狀態。 |
off_release_check_chap_authentication |
off_release_check_chap_authentication | PowerStore:升級前健全狀況檢查 (PUHC) 偵測 CHAP 傳輸連線是否已正確設定。 |
The maintenance window is configured. |
偵測是否已設定維護時段。僅適用於系統不會在 NDU 前自動啟用維護時段的 OS 版本 | PowerStore:升級前健全狀況檢查 (PUHC) 可偵測尚未設定維護時段 |
Detect a secondary IP issue. |
偵測 NVMe 擴充機櫃上的次要 IP 問題 | PowerStore:升級前健全狀況檢查 (PUHC) 可偵測 ENS24 NVMe 擴充機櫃上的次要 IP 設定發生問題。 |
SDNAS snapshot limit |
偵測 SDNAS 快照是否超過其限制 | PowerStore:系統健全狀況檢查可偵測已超過 SDNAS 快照限制 |
Duplicate FW entry check |
偵測節點內部狀態記錄 (登錄檔) 中的重複元件韌體項目 | PowerStore:系統健全狀況檢查可偵測重複的韌體項目 |
Initiator connectivity check |
偵測是否存在任何非備援啟動器 | PowerStore:系統健全狀況檢查偵測到非備援啟動器 |
Reboot flag set |
偵測是否已設定重開機標記 | PowerStore:系統健全狀況檢查可偵測已設定重開機標記 |
Recovery partition image check |
偵測復原分割區中的錯誤檔名 | PowerStore:健全狀況檢查可偵測檔名、復原分割區或 PowerStoreOS 套裝版本的問題 |
off_release_sdnas_remote_network_alert_check |
偵測 NAS 複寫介面不相符 | PowerStore:升級前健全狀況檢查 (PUHC) 可偵測 NAS 複寫工作階段的介面不相符 |
off_release_stale_scsi3_reg_check |
檢查系統是否有任何過時的 SCSI-3 保留 | PowerStore:升級前健全狀況檢查可偵測過時的 SCSI-3 保留問題 |
empty_vg_no_memebers |
偵測是否存在控制路徑 (CP) 中沒有成員的磁碟區群組 | PowerStore:健全狀況檢查可偵測是否存在無成員的磁碟區群組 |
off_release_ens24_drive_missing_path_check |
檢查系統是否有故障或遺失的非備援 NVMe 磁碟機路徑 | PowerStore:預先升級健全狀況檢查 (PUHC),以偵測非備援 NVMe 磁碟機路徑 |
off_release_scsi3_reservation_check |
檢查系統是否存在現有的 SCSI-3 保留 | PowerStore:升級前健全狀況檢查可偵測現有的 SCSI3 保留 |
off_release_sdnas_last_event_id_check |
偵測 SdnasLastProcessedEventId 數目是否大到足以造成記憶體不足的問題 | PowerStore:升級前健全狀況檢查 (PUHC) 可偵測 SdnasLastProcessedEventId 數目是否大到足以導致「記憶體不足」問題。 |
off_release_new_firmware_zip_existence_check |
偵測遺失預先準備的 FW .zip 檔案問題,以防止 NDU 失敗 | PowerStore:升級前健全狀況檢查 (PUHC) 可偵測是否「已從 FW 分割區之暫存區抹除新的 FW zip」 |
off_release_sdnas_memory_config |
偵測 NAS 容器的平台限制與 NAS 嘗試內部分配的限制之間,是否有不相符的情況 | PowerStore:升級前健全狀況檢查 (PUHC) 可偵測 SDNAS 記憶體組態問題 |
off_release_nvme_reservation_check |
偵測叢集上是否存在 NVMe 保留 | PowerStore:升級前健全狀況檢查 (PUHC) 可偵測叢集上是否存在 NVMe 保留 |
off_release_dp_mem_override_file_exists |
偵測是否存在現有的資料路徑 (DP) 記憶體覆寫檔案 | PowerStore:升級前健全狀況檢查 (PUHC) 可偵測資料路徑記憶體的 OOM 覆寫 |
off_release_removed_third_party_certificate_check |
偵測缺少的第三方憑證鏈結 | PowerStore:升級前健全狀況檢查 (PUHC) 可偵測 reset_certificates REST 端點問題 |
user_db_fewer_records |
偵測受影響裝置的節點之間,必要的 user.db 項目是否遺失或有差異 | PowerStore:升級前健全狀況檢查 (PUHC) 可偵測各節點之間的必要 user.db 項目是否遺失或有差異 |
off_release_vol_in_destroying_state_check |
偵測磁碟區是否處於「正在銷毀」狀態 | PowerStore:升級前健全狀況檢查 (PUHC) 可偵測磁碟區處於「正在銷毀」狀態 |
off_release_incomplete_commands_check |
偵測在 NDU 期間,不屬於核准命令清單內且不完整的控制路徑 (CP) 命令 | PowerStore:PUHC 可偵測不完整的 CP 命令 - off_release_incomplete_commands_check |
off_release_inter_cluster_tcp_conn_check |
偵測叢集之間是否存在不完整的 TCP 連線 | PowerStore:升級前健全狀況檢查 (PUHC) 可偵測叢集之間的不完整 TCP 連線 |
off_release_stale_gsips_in_remote_rtps_check |
偵測遠端相對目標連接埠 (RTP) 中遺留的任何不存在全域儲存探索 IP (GSIP) | PowerStore:升級前健全狀況檢查可偵測遠端 RTP 中的過時 GSIP |
系統檢查
圖例:在此表格中,符號 * 表示此為最新版健全狀況檢查精簡型套裝中新引進/經強化的檢查項目。
表 6.PowerStore-health_check-3.6.1.5-2691230-retail.tgz.bin系統檢查
| 測試名稱 | 說明 | KB 文章 |
|---|---|---|
off_release_nvram_full_fips_mode |
偵測 NVRAM 磁碟的完整 FIPS 組態是否設定正確 | PowerStore:系統健全狀況檢查和/或升級前健全狀況檢查 3.x/4.x | 更換 NVMe NVRAM 磁碟可能會誤發 FIPS 警示 |
off_release_unsupported_drive_check |
偵測是否能在系統 driveDB.json 檔案中找到所有已安裝的磁碟機 | PowerStore 健全狀況檢查可識別系統中是否存在 DriveDB.json v0.6.6.0 未涵蓋的磁碟機 |
ppds_dsb_check |
偵測過時的 DSB 資訊 | PowerStore:系統檢查可偵測平台資料服務資訊已過時。 |
indus_encryption_offset_check |
偵測 NVMe 擴充機櫃的磁碟機是否存在無效的加密頻段位置 | PowerStore:系統檢查可偵測 NVMe 擴充機櫃 (ENS24) 磁碟機無效加密頻段位置。 |
dp_dedupe_destage_leak_check |
偵測導致磁碟機過度耗損的非必要寫回作業 | PowerStore:系統檢查可偵測不必要的寫回作業 |
kr_link_boot_option_check |
偵測 500T 裝置的兩個節點上是否未啟用 KR 連結 PXE 引導選項 | PowerStore:系統檢查偵測 PowerStore 500T 裝置的兩個節點上是否未啟用 KR 連結 PXE 引導選項。 |
iom_activation_check |
防止在未啟用情況下對 IOM/SLIC 進行 NDU | PowerStore:健全狀況檢查偵測到已新增但無法識別的 NVMe 擴充機櫃 (ENS24)。 |
dp_resiliency_mode_check |
偵測到回復模式未正常結束 (vDisk 問題) | PowerStore:系統檢查可偵測裝置不必要地保持在回復模式。 |
sdnas_capacity_alert_check |
偵測 FS 容量警示是否在升級後停用 | PowerStore:升級後已停用檔案系統使用容量警示。 |
unfinished_ndu_check |
偵測是否存在未完成的升級作業 | PowerStore:系統健全狀況檢查偵測到失敗的 NDU 認可殘餘部分。 |
silent_drive_failure_check |
偵測 KB 000216381 的問題,PowerStore:SSD 故障,未顯示警示 | PowerStore:健全狀況檢查可偵測 SSD 遺失問題。 |
target_port_group_id_check |
偵測影響 NVMeoF 磁碟區對應的目標連接埠群組問題 | PowerStore:系統健全狀況檢查可偵測可能影響 NVMeoF 磁碟區對應的目標連接埠群組問題。 |
indus_drive_paths_check |
偵測 ENS24 NVMe 擴充機櫃不穩定的路徑 | PowerStore:系統健全狀況檢查可偵測不穩定的 ENS24 NVMe 擴充機櫃路徑。 |
dimm_sn_check |
偵測 DIMM 序號不一致 | PowerStore:系統健全狀況檢查可偵測 DIMM 序號不一致。 |
recovery_partition_image_check |
偵測復原分割區中的錯誤檔名 | PowerStore:系統健全狀況檢查復原分割區中的檔案名稱是否不正確。 |
duplicate_fw_entry_check |
偵測節點內部狀態記錄 (登錄檔) 中的重複元件韌體項目 | PowerStore:系統健全狀況檢查可偵測重複的韌體項目。 |
cpu_ierr_check |
檢查是否有 CPU 內部錯誤 | PowerStore:系統健全狀況檢查可偵測 CPU IERR 檢查發生問題。 |
InitiatorConnectivityCheck |
偵測非備援啟動器 | PowerStore:系統健全狀況檢查偵測到非備援啟動器。 |
icd_network_check |
偵測遺失與 ToR 的連線能力 | PowerStore:系統健全狀況檢查偵測到 ICD 網路連線問題。 |
dimm_correctable_error_check |
偵測 DIMM 可修正錯誤 (CE) 計數 (5k 個閾值) | PowerStore:系統健全狀況檢查可偵測 DIMM 可修正錯誤 (CE) 計數過多。 |
active_system_alert_check |
偵測作用中重大和關鍵警示 | PowerStore:作用中警示是由健全狀況檢查所偵測到。 |
cyc_node_space_check |
偵測節點的 /cyc_node 目錄空間不足 | PowerStore:系統健全狀況檢查可偵測 /cyc_node 中缺少空間。 |
time_skew_check |
偵測不受支援的大時間偏差 | PowerStore:系統健全狀況檢查可偵測節點和 BMC 上的高時間偏差。 |
db_tmpfiles_check |
偵測大於預期的資料庫暫存檔案 | PowerStore:系統健全狀況檢查可偵測大量資料庫暫存檔案。 |
bbu_sensor_check |
偵測各種 BBU 健全狀況檢查中的故障 | PowerStore:系統健全狀況檢查可偵測無效的電池狀態。 |
component_sn_check |
偵測 BBU 或 PSU 的序號不一致 | PowerStore:系統健全狀況檢查可偵測元件序號不一致:fru_items_sn_check |
fsck_leftover_check |
偵測是否存在 fsck 產生的檔案 cyc-sys-mode-override.txt | PowerStore:系統健全狀況檢查可偵測復原檔案。 |
component_stale_fw_check |
偵測韌體是否為最新狀態,以及是否與 Dell X.509 簽章相容 | PowerStore:系統健全狀況檢查偵測是否需要韌體升級。 |
transit_connection_check |
偵測資料路徑中是否存在傳輸連線物件 | PowerStore:系統檢查可偵測孤立的傳輸連線物件 |
symmd_on_disk_check |
偵測磁碟上是否儲存了最新的 System Manager Metadata on Disk (SYMMD) 資料 | PowerStore:系統健全狀況檢查可偵測磁碟上過時的 System Manager Metadata on Disk (SYMMD) 資料 |
kernel_slab_check |
偵測是否有任何節點的 Slab 分配超過 skbuff_fclone_cache 限制 | PowerStore:系統健全狀況檢查可偵測是否有任何節點的 Slab 分配超過 skbuff_fclone_cache 限制 |
2.1.x 的健全狀況檢查套裝。
下表列出執行狀況檢查中的 PowerStore-health_check-2.1.1.2-2069723-retail.tgz.bin 健全狀況檢查薄型套件。此套件相容於 PowerStoreOS 2.1.x 版。它與版本 3.x 或 4.x 不相容。
表 7.PowerStore-health_check-2.1.1.2-2069723-retail.tgz.bin執行狀況檢查
| 測試名稱 | 說明 | 故障的 KB |
|---|---|---|
mtc_drive_counter_check |
偵測 MTC NVRAM 磁碟機問題 | PowerStore:系統健全狀況檢查可偵測 MTC NVRAM 磁碟機問題。 |
drive_flags_check |
偵測離線和故障的磁碟機,包括未發出警示的磁碟機 | PowerStore:系統健全狀況檢查可偵測 SSD 離線或故障。 |
bbu_sensor_check |
偵測各種 BBU 健全狀況檢查中的故障 | PowerStore:系統健全狀況檢查可偵測無效的電池狀態。 |
kms_lockbox_file_check |
偵測 DARE 加密箱問題 | PowerStore:健全狀況檢查可偵測加密箱問題。 |
os_package_name_check |
偵測復原分割區中的錯誤檔名 | PowerStore:健全狀況檢查可偵測檔案名稱、復原分割區或 PowerStoreOS 套裝版本發生問題。 |
duplicate_fw_entry_check |
偵測節點內部狀態記錄 (登錄檔) 中的重複元件韌體項目。 | PowerStore:系統健全狀況檢查可偵測重複的韌體項目。 |
fsck_leftover_check |
偵測到未預期的復原檔案 | PowerStore:系統健全狀況檢查可偵測復原檔案。 |
recovery_partition_image_check |
偵測復原分割區中的錯誤檔名 | PowerStore:系統健全狀況檢查復原分割區中的檔案名稱是否不正確。 |
symmetric_icm_connection |
偵測 ICM 連線遺失 | PowerStore:健全狀況檢查套裝可檢查是否發生非對稱 ICM 連線失敗 |
cpu_ierr_check |
檢查是否有 CPU 內部錯誤 | PowerStore:系統健全狀況檢查可偵測 CPU IERR 檢查發生問題。 |
InitiatorConnectivityCheck |
偵測非備援啟動器 | PowerStore:系統健全狀況檢查偵測到非備援啟動器。 |
icd_network_check |
偵測遺失與 ToR 的連線能力 | PowerStore:系統健全狀況檢查偵測到 ICD 網路連線問題。 |
symmd_fw_upgrade_flag_check |
偵測處於無效狀態的 PSU | PowerStore:系統健全狀況檢查可偵測 PSU 狀態不正確。 |
dimm_correctable_error_check |
偵測 DIMM CE 計數 (5k 個閾值) | PowerStore:系統健全狀況檢查可偵測 DIMM 可修正錯誤 (CE) 計數過多。 |
active_system_alert_check |
偵測作用中重大和關鍵警示 | PowerStore:作用中警示是由健全狀況檢查所偵測到。 |
cyc_node_space_check |
偵測節點的 /cyc_node 目錄空間不足 | PowerStore:系統健全狀況檢查可偵測 /cyc_node 中缺少空間。 |
time_skew_check |
偵測不受支援的大時間偏差 | PowerStore:系統健全狀況檢查可偵測節點和 BMC 上的高時間偏差。 |
db_tmpfiles_check |
偵測大於預期的資料庫暫存檔案 | PowerStore:系統健全狀況檢查可偵測大量資料庫暫存檔案。 |
bbu_ipmi_i2c_check |
偵測各種 BBU 健全狀況檢查中的故障 | PowerStore:系統健全狀況檢查可偵測無效的電池狀態。 |
ru_items_sn_check |
偵測 BBU 或 PSU 的序號不一致 | PowerStore:系統健全狀況檢查可偵測元件序號不一致:fru_items_sn_check |