PowerProtect:Kubernetesバックアップが「controller pod is not running」エラーで失敗する
摘要: PPDM Kubernetesバックアップが「controller pod is not running」エラーで失敗する問題について説明します。
本文适用于
本文不适用于
本文并非针对某种特定的产品。
本文并非包含所有产品版本。
症状
この問題が確認されたインスタンスでは、サーバーのディザスター リカバリー バックアップからPPDMをリカバリーした後、すべてのPPDM Kubernetesバックアップが失敗し始めます。ただし、他の状況でも発生することがあります。
Kubernetesバックアップが「controller pod is not running」エラーで失敗します。
ログに以下のエラーが表示されます。
2021-07-21T03:49:48.340Z ERROR [] [task-5011a057-340f-40fb-8cd8-12414685d058] [][][][TRACE_ID:a66ce529604914ad;JOB_ID:a9b8915af1637407][] [K8sHelperApi.isDone(90)] - Failed to wait on job com.emc.dpsg.ecdm.baseresourceservice.exception.ValidationServiceException: controller pod is not running
2021-07-21T03:50:14.065Z WARN [] [dsSource-plpd-testcluster] [][][][][] [c.e.b.c.s.p.K8sHealthMonitor.checkPodHealth(200)] - Controller Pod is down, cluster: , age=PT153H49M43.065S
そのk8sクラスターに対するkubectl describe pod -n powerprotectコマンドの出力:
powerprotect powerprotect-controller-666ffccbbf-p5rwh 0/1 ImagePullBackOff 0 6d12h
velero-ppdm backup-driver-587cfcdf59-2mc8p 1/1 Running 0 49d
velero-ppdm velero-5df5fcd896-p68rw 1/1 Running 0 49d
Kubernetesバックアップが「controller pod is not running」エラーで失敗します。
ログに以下のエラーが表示されます。
2021-07-21T03:49:48.340Z ERROR [] [task-5011a057-340f-40fb-8cd8-12414685d058] [][][][TRACE_ID:a66ce529604914ad;JOB_ID:a9b8915af1637407][] [K8sHelperApi.isDone(90)] - Failed to wait on job com.emc.dpsg.ecdm.baseresourceservice.exception.ValidationServiceException: controller pod is not running
2021-07-21T03:50:14.065Z WARN [] [dsSource-plpd-testcluster] [][][][][] [c.e.b.c.s.p.K8sHealthMonitor.checkPodHealth(200)] - Controller Pod is down, cluster: , age=PT153H49M43.065S
そのk8sクラスターに対するkubectl describe pod -n powerprotectコマンドの出力:
powerprotect powerprotect-controller-666ffccbbf-p5rwh 0/1 ImagePullBackOff 0 6d12h
velero-ppdm backup-driver-587cfcdf59-2mc8p 1/1 Running 0 49d
velero-ppdm velero-5df5fcd896-p68rw 1/1 Running 0 49d
原因
PowerProtectコントローラー ポッドがインターネットから必要なイメージを取得できません。
解决方案
1.Kubernetesクラスターがhttps://hub.docker.com/からDocker Hubに、またhttps://quay.io/からQuayにアクセスして、必要なイメージを取得できるかどうかを確認します。
2.ファイアウォールやその他の制限によりKubernetesクラスターがこれらのサイトにアクセスできない場合は、クラスターがアクセスできるローカル レジストリーにこれらのイメージをプルできます。以下の手順に従ってください。
1)Protect Data Managerアプライアンスで、/usr/local/brs/cndm/config/application.propertiesに
application.propertiesファイルを次の内容で作成します。k8s.docker.registry=fqdn:port(例:k8s.docker.registry=artifacts.example.com:8446
k8s.image.pullsecrets=secret resource name)イメージ プル シークレットが必要な場合にのみ、このエントリーを指定します。
2)cndm restartを実行してプロパティを適用します。
メモ:詳細については、『PPDM Administration and User Guide』を参照してください。
3.KubernetesクラスターはすでにPPDM GUIで資産ソースとして追加されているため、手順1または2をチェック/実行した後にKubernetesクラスターを手動で検出する必要があります。
2.ファイアウォールやその他の制限によりKubernetesクラスターがこれらのサイトにアクセスできない場合は、クラスターがアクセスできるローカル レジストリーにこれらのイメージをプルできます。以下の手順に従ってください。
1)Protect Data Managerアプライアンスで、/usr/local/brs/cndm/config/application.propertiesに
application.propertiesファイルを次の内容で作成します。k8s.docker.registry=fqdn:port(例:k8s.docker.registry=artifacts.example.com:8446
k8s.image.pullsecrets=secret resource name)イメージ プル シークレットが必要な場合にのみ、このエントリーを指定します。
2)cndm restartを実行してプロパティを適用します。
メモ:詳細については、『PPDM Administration and User Guide』を参照してください。
3.KubernetesクラスターはすでにPPDM GUIで資産ソースとして追加されているため、手順1または2をチェック/実行した後にKubernetesクラスターを手動で検出する必要があります。
受影响的产品
PowerProtect Data Manager文章属性
文章编号: 000190024
文章类型: Solution
上次修改时间: 27 8月 2022
版本: 6
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。