PowerFlex:未建立 CloudIQ 的效能套裝

摘要: 閘道 (GW) 未產生 CloudIQ 的效能套裝,但組態、容量和警示會如預期產生。

本文章適用於 本文章不適用於 本文無關於任何特定產品。 本文未識別所有產品版本。

症狀

當系統設定為傳送 CloudIQ 特徵和統計資料時,GW 會產生系統組態、系統容量、系統警示和系統效能統計資料。

預設情況下,無法手動停止建立四個套裝中的任何一個。

GW 無法收集磁碟區統計資料並產生效能套裝,因為其與 MDM 之間的 RestAPI 回應解譯發生問題。
如需有關資料收集和產生流程的詳細資訊,請參閱「其他資訊」一節。

您可以在 GW scaleio-trace.log 檔案中找到下列例外錯誤:

2022-08-05 12:05:53,975 [AsyncHandler-21] ERROR c.e.scaleio.esrsmanager.EsrsManager - Alert hasn't been sent since ESRS reached limit of 200 per: 8 hours
com.emc.scaleio.esrsmanager.NotificationMessageLimitException: null   <<<
    at com.emc.scaleio.esrsmanager.ESRSConnector.sendConnectEmcMessage(ESRSConnector.java:360) ~[ams-1.0-SNAPSHOT.jar:na]
    at com.emc.scaleio.esrsmanager.ESRSConnector.sendConnectEmcMessage(ESRSConnector.java:308) ~[ams-1.0-SNAPSHOT.jar:na]
    at com.emc.scaleio.esrsmanager.EsrsManager.sendAlert(EsrsManager.java:566) [ams-1.0-SNAPSHOT.jar:na]
    at com.emc.scaleio.esrsmanager.EsrsManager.sendAlert(EsrsManager.java:598) [ams-1.0-SNAPSHOT.jar:na]
    at com.emc.scaleio.esrsmanager.BaseNotificationManager.busReceivedAlerts(BaseNotificationManager.java:103) [ams-1.0-SNAPSHOT.jar:na]
...
2022-08-05 12:05:53,975 [https-jsse-nio-443-exec-293] ERROR c.e.s.s.r.DeviceRepositoryImpl - Error in QueryPropertiesResponse for Device::-101652817808130048 property:PENDING_MOVING_OUT_FWD_REBUILD_JOBS has value type: UNDEFINED_PROP_TYPE
2022-08-05 12:05:53,975 [https-jsse-nio-443-exec-293] ERROR c.e.s.s.r.DeviceRepositoryImpl - Error in QueryPropertiesResponse for Device::-101652817808130048 property:NET_THIN_USER_DATA_CAPACITY_IN_KB has value type: UNDEFINED_PROP_TYPE
...
2022-08-05 12:05:53,982 [https-jsse-nio-443-exec-306] ERROR c.e.s.s.r.DeviceRepositoryImpl - Error in QueryPropertiesResponse for Device::-99119590261981183 property:PENDING_MOVING_OUT_FWD_REBUILD_JOBS has value type: UNDEFINED_PROP_TYPE
2022-08-05 12:05:53,982 [https-jsse-nio-443-exec-290] ERROR c.e.s.s.r.DeviceRepositoryImpl - Error in QueryPropertiesResponse for Device::-99401056648822783 property:RFCACHE_WRITES_SKIPPED_STUCK_IO has value type: UNDEFINED_PROP_TYPE
2022-08-05 12:05:53,982 [https-jsse-nio-443-exec-310] ERROR c.e.s.s.w.c.ScaleIOController - Got an exception in handleException
java.lang.IllegalStateException: Bad number: 3   <<<
    at com.emc.s3g.scaleio.domain.enums.ScsiReserveType.valueOf(ScsiReserveType.java:42) ~[ams-1.0-SNAPSHOT.jar:na]
    at com.emc.s3g.scaleio.repository.BaseRepository.updateStatistics(BaseRepository.java:1184) ~[repository-1.0-SNAPSHOT.jar:na]
    at com.emc.s3g.scaleio.repository.BaseRepository.getStatistics(BaseRepository.java:981) ~[repository-1.0-SNAPSHOT.jar:na]
    at com.emc.s3g.scaleio.web.controller.ScaleIOController.getStatistics(ScaleIOController.java:93) ~[classes/:na]
    at sun.reflect.GeneratedMethodAccessor731.invoke(Unknown Source) ~[na:na]

正常運作的系統範例:

root@working_cloudiq ~]# ls -lrt /opt/emc/scaleio/gateway/temp
total 300
drwx------. 2 root root 25 Feb 28 2020 certificates
drwx------. 2 root root 6 Feb 28 2020 scaleio-install-logs
-rwx------. 1 root root 0 Feb 28 2020 216e5abe-29e9-4825-b095-d8900d5964d8_ScaleIO-config.json
-rwx------. 1 root root 0 Jan 12 2022 safeToDelete.tmp
-rwx------. 1 root root 521 Jan 12 2022 index.html
-rwx------. 1 root root 0 Mar 20 01:36 GATEWAY_RUN_USER.txt
-rw-r-----. 1 root root 95929 Jul 14 08:33 powerflex_1657787617941_ELMSIO1234568_config.zip
-rw-r-----. 1 root root 47245 Jul 15 07:34 powerflex_1657870447081_ELMSIO1234568_capacity.zip
-rw-r-----. 1 root root 95935 Jul 15 08:33 powerflex_1657874022010_ELMSIO1234568_config.zip
-rw-r-----. 1 root root 47330 Jul 15 08:34 powerflex_1657874048125_ELMSIO1234568_capacity.zip
-rw-r-----. 1 root root 2671 Jul 15 09:02 powerflex_1657875734080_ELMSIO1234568_alerts.zip
-rw-r-----. 1 root root 2671 Jul 15 09:02 powerflex_1657875734085_ELMSIO1017KPF3_performance.zip   <<<
-rw-r-----. 1 root root 2670 Jul 15 09:07 powerflex_1657876034745_ELMSIO1234568_alerts.zip
-rw-r-----. 1 root root 2670 Jul 15 09:07 powerflex_1657876034750_ELMSIO1017KPF3_performance.zip   <<<

無法正常運作的系統範例 - performance.zip 未產生檔案:

root@not_working_cloudiq ~]# ls -lrt /opt/emc/scaleio/gateway/temp
total 300
drwx------. 2 root root 25 Feb 28 2020 certificates
drwx------. 2 root root 6 Feb 28 2020 scaleio-install-logs
-rwx------. 1 root root 0 Feb 28 2020 216e5abe-29e9-4825-b095-d8900d5964d8_ScaleIO-config.json
-rwx------. 1 root root 0 Jan 12 2022 safeToDelete.tmp
-rwx------. 1 root root 521 Jan 12 2022 index.html
-rwx------. 1 root root 0 Mar 20 01:36 GATEWAY_RUN_USER.txt
-rw-r-----. 1 root root 95929 Jul 14 08:33 powerflex_1657787617941_ELMSIO1234568_config.zip
-rw-r-----. 1 root root 47245 Jul 15 07:34 powerflex_1657870447081_ELMSIO1234568_capacity.zip
-rw-r-----. 1 root root 95935 Jul 15 08:33 powerflex_1657874022010_ELMSIO1234568_config.zip
-rw-r-----. 1 root root 47330 Jul 15 08:34 powerflex_1657874048125_ELMSIO1234568_capacity.zip
-rw-r-----. 1 root root 2671 Jul 15 09:02 powerflex_1657875734080_ELMSIO1234568_alerts.zip
-rw-r-----. 1 root root 2670 Jul 15 09:07 powerflex_1657876034745_ELMSIO1234568_alerts.zip

原因

PowerFlex 支援 SCSI-2 保留和 SCSI-3 保留命令的子集。SCSI 保留命令 (重設、保留、釋放、讀取) 會由 SDC 傳送至 MDM,然後更新 SDS。
當磁碟區上已建立 SCSI-3 保留時,RestAPI 會從 GW 呼叫至 MDM,讀取磁碟區統計資料,然後失敗並出現上述錯誤 -錯誤號碼:3.

GW 會誤解 SCSI 保留類型,並使從 MDM 傳回的 RestAPI 呼叫失敗。
PowerFlex 端的 I/O 和保留如預期運作。

如何在 get_info 中驗證 SCSI 保留資訊?

$ awk 'BEGIN { printf "%-15s %-15s %s\n", "Volume_ID", "Volume_Name", "SCSI_Reservation"; printf "%-15s %-15s %s\n", "---------", "-----------", "----------------" }; /: ID:/ { volume_id = $2; volume_name = $3 } / SCSI-reserver-key:/ { scsi_reserv = $1; if (scsi_reserv == "scsi2-reserved:3"){ printf "%-15s %-15s %-15s %s\n", volume_id, volume_name, scsi_reserv, "<<< SCSI-3 !!!" } else{ printf "%-15s %-15s %s\n", volume_id, volume_name, scsi_reserv } }' getInfoDump/mdm/sdbg_out.txt | column -t
Volume_ID                Volume_Name          SCSI_Reservation
---------                -----------          ----------------
ID:0x2fad5f7f00000000    Name:vol1-sp1-PD1    scsi2-reserved:0
ID:0x2fad5fcb00000001    Name:vol2-sp1-PD1    scsi2-reserved:3  <<<  SCSI-3  !!!
ID:0x2fad5fcc00000002    Name:vol3-sp1-PD1    scsi2-reserved:3  <<<  SCSI-3  !!!
ID:0x2fa9dd3d00000003    Name:vol4-sp1-PD1    scsi2-reserved:0

如何在即時系統上驗證 SCSI 保留資訊?

$ cat > script
c mdm
dumpallscreens
disconnect
exit
^D
$ /opt/emc/scaleio/sds/diag/sdbg script > sdbg_out.txt
$ awk 'BEGIN { printf "%-15s %-15s %s\n", "Volume_ID", "Volume_Name", "SCSI_Reservation"; printf "%-15s %-15s %s\n", "---------", "-----------", "----------------" }; /: ID:/ { volume_id = $2; volume_name = $3 } / SCSI-reserver-key:/ { scsi_reserv = $1; if (scsi_reserv == "scsi2-reserved:3"){ printf "%-15s %-15s %-15s %s\n", volume_id, volume_name, scsi_reserv, "<<< SCSI-3 !!!" } else{ printf "%-15s %-15s %s\n", volume_id, volume_name, scsi_reserv } }' sdbg_out.txt | column -t

Volume_ID                Volume_Name          SCSI_Reservation
---------                -----------          ----------------
ID:0x2fae49da00000001    Name:vol1-sp1-PD1    scsi2-reserved:0
ID:0x2fad5fcb00000002    Name:vol2-sp1-PD1    scsi2-reserved:3  <<<  SCSI-3  !!!
ID:0x2fad5fcc00000003    Name:vol3-sp1-PD1    scsi2-reserved:3  <<<  SCSI-3  !!!
ID:0x2fa9dd3d00000004    Name:vol4-sp1-PD1    scsi2-reserved:0

解析度

由於 SCSI 保留是由用戶端和應用程式端設置的,因此唯一的解決方法是從卷中釋放保留。

受影響的版本

PowerFlex v3.5
PowerFlex v3.6
PowerFlex v4.0

已修正版本

PowerFlex v3.5.1.9
PowerFlex v3.6.1
PowerFlex v4.0.1.1

其他資訊

收集和建立效能套裝檔案的流程包含兩個獨立的程序:

可使用  第一個過程  已啟動  每 5 秒  並從 MDM 發送統計資訊請求,並以累積方式存儲回應。

可使用  第二道工序  已啟動  每 5 分鐘一班  它會計算增量,並將資料壓縮至 /opt/emc/scaleio/gateway/temp 目錄內的.zip檔案中。

受影響的產品

PowerFlex Appliance, PowerFlex custom node, PowerFlex Software
文章屬性
文章編號: 000208018
文章類型: Solution
上次修改時間: 16 5月 2026
版本:  5
向其他 Dell 使用者尋求您問題的答案
支援服務
檢查您的裝置是否在支援服務的涵蓋範圍內。