PowerProtect:Kubernetes 備份失敗,傳回錯誤「controller pod is not running」

摘要: PPDM Kubernetes 備份失敗,傳回錯誤「controller pod is not running」

本文适用于 本文不适用于 本文并非针对某种特定的产品。 本文并非包含所有产品版本。

症状

在發現此情況時,從伺服器災難回復備份復原 PPDM 後,所有 PPDM Kubernetes 備份都會開始失敗。不過,這也可能適用於其他情況。
Kubernetes 備份失敗,傳回錯誤「controller pod is not running」。

在記錄中可能會看到下列錯誤:
2021-07-21T03:49:48.340Z ERROR [] [task-5011a057-340f-40fb-8cd8-12414685d058] [][][][TRACE_ID:a66ce529604914ad;JOB_ID:a9b8915af1637407][] [K8sHelperApi.isDone(90)] - Failed to wait on job com.emc.dpsg.ecdm.baseresourceservice.exception.ValidationServiceException: controller pod is not running
2021-07-21T03:50:14.065Z WARN [] [dsSource-plpd-testcluster] [][][][][] [c.e.b.c.s.p.K8sHealthMonitor.checkPodHealth(200)] - Controller Pod is down, cluster: , age=PT153H49M43.065S


k8s 叢集的 kubectl describe pod -n powerprotect 命令輸出結果:
powerprotect     powerprotect-controller-666ffccbbf-p5rwh                   0/1     ImagePullBackOff   0          6d12h
velero-ppdm      backup-driver-587cfcdf59-2mc8p                             1/1     Running            0          49d
velero-ppdm      velero-5df5fcd896-p68rw                                    1/1     Running            0          49d



原因

Powerprotect 控制器 pod 無法從網際網路擷取必要映像。

解决方案

1.檢查 Kubernetes 叢集是否可在 https://hub.docker.com/ 存取 Docker Hub,以及在 https://quay.io/ 進行查詢,以擷取必要映像。

2.如果由於防火牆或其他限制,導致 Kubernetes 叢集無法存取這些網站,您可以將這些映像擷取到叢集可以存取的本機登錄檔。請按照以下程序操作。
1).在 PowerProtect Data Manager 裝置上建立 application.properties 檔案 /usr/local/brs/lib/cndm/config/application.properties,
其內容如下:
k8s.docker.registry=fqdn:port 例如,k8s.docker.registry=artifacts.example.com:8446
k8s.image.pullsecrets=secret resource name 僅在您需要私密擷取映像時才指定此項目。
2).執行 cndm 重新開機以套用屬性。
注意:如需詳細資訊,請參閱 PPDM 管理與使用者指南。

3.由於已在 PPDM GUI 中將 Kubernetes 叢集新增為資產來源,因此在檢查/執行步驟 1 或 2 後,必須手動探索 Kubernetes 叢集。 

受影响的产品

PowerProtect Data Manager
文章属性
文章编号: 000190024
文章类型: Solution
上次修改时间: 27 8月 2022
版本:  6
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。