PowerProtect: O backup do Kubernetes apresentou falha com o erro "controller pod is not running"
摘要: O backup do PPDM Kubernetes apresentou falha com o erro "controller pod is not running"
本文适用于
本文不适用于
本文并非针对某种特定的产品。
本文并非包含所有产品版本。
症状
Na instância em que isso foi observado, todos os backups do PPDM Kubernetes começaram a falhar após a recuperação do PPDM a partir do backup de recuperação de desastres do servidor. No entanto, isso pode ocorrer em outra situação.
O backup do Kubernetes apresentou falha com o erro "controller pod is not running".
O erro abaixo pode ser observado nos logs:
2021-07-21T03:49:48.340Z ERROR [] [task-5011a057-340f-40fb-8cd8-12414685d058] [][][][TRACE_ID:a66ce529604914ad;JOB_ID:a9b8915af1637407][] [K8sHelperApi.isDone(90)] - Failed to wait on job com.emc.dpsg.ecdm.baseresourceservice.exception.ValidationServiceException: controller pod is not running
2021-07-21T03:50:14.065Z WARN [] [dsSource-plpd-testcluster] [][][][][] [c.e.b.c.s.p.K8sHealthMonitor.checkPodHealth(200)] - Controller Pod is down, cluster:
Saída do comando kubectl describe pod -n powerprotect para esse cluster k8s:
powerprotect powerprotect-controller-666ffccbbf-p5rwh 0/1 ImagePullBackOff 0 6d12h
velero-ppdm backup-driver-587cfcdf59-2mc8p 1/1 Running 0 49d
velero-ppdm velero-5df5fcd896-p68rw 1/1 Running 0 49d
O backup do Kubernetes apresentou falha com o erro "controller pod is not running".
O erro abaixo pode ser observado nos logs:
2021-07-21T03:49:48.340Z ERROR [] [task-5011a057-340f-40fb-8cd8-12414685d058] [][][][TRACE_ID:a66ce529604914ad;JOB_ID:a9b8915af1637407][] [K8sHelperApi.isDone(90)] - Failed to wait on job com.emc.dpsg.ecdm.baseresourceservice.exception.ValidationServiceException: controller pod is not running
2021-07-21T03:50:14.065Z WARN [] [dsSource-plpd-testcluster] [][][][][] [c.e.b.c.s.p.K8sHealthMonitor.checkPodHealth(200)] - Controller Pod is down, cluster:
Saída do comando kubectl describe pod -n powerprotect para esse cluster k8s:
powerprotect powerprotect-controller-666ffccbbf-p5rwh 0/1 ImagePullBackOff 0 6d12h
velero-ppdm backup-driver-587cfcdf59-2mc8p 1/1 Running 0 49d
velero-ppdm velero-5df5fcd896-p68rw 1/1 Running 0 49d
原因
O pod do controlador do PowerProtect não consegue obter a imagem necessária da Internet.
解决方案
1. Verifique se o cluster do Kubernetes pode acessar o hub do Docker em https://hub.docker.com/ e o Quay em https://quay.io/ para obter as imagens necessárias.
2. Se um cluster do Kubernetes não puder acessar esses locais devido a firewall ou outras restrições, você poderá extrair essas imagens para um registro local que o cluster possa acessar. Siga o procedimento abaixo.
1). Crie um arquivo application.properties /usr/local/brs/lib/cndm/config/application.properties
no equipamento PowerProtect Data Manager com o seguinte conteúdo:
k8s.docker.registry=fqdn:port Por exemplo, k8s.docker.registry=artifacts.example.com:8446
k8s.image.pullsecrets=secret resource name Especifique essa entrada somente se você exigir uma senha para a extração de imagem.
2). Execute cndm restart para aplicar as propriedades.
Nota: Consulte o Guia de administração e do usuário do PPDM para obter mais detalhes.
3. Como o cluster do Kubernetes já foi adicionado como uma origem de ativo na GUI do PPDM, uma detecção manual do cluster do Kubernetes é necessária após a etapa 1 ou 2 ser verificada/executada.
2. Se um cluster do Kubernetes não puder acessar esses locais devido a firewall ou outras restrições, você poderá extrair essas imagens para um registro local que o cluster possa acessar. Siga o procedimento abaixo.
1). Crie um arquivo application.properties /usr/local/brs/lib/cndm/config/application.properties
no equipamento PowerProtect Data Manager com o seguinte conteúdo:
k8s.docker.registry=fqdn:port Por exemplo, k8s.docker.registry=artifacts.example.com:8446
k8s.image.pullsecrets=secret resource name Especifique essa entrada somente se você exigir uma senha para a extração de imagem.
2). Execute cndm restart para aplicar as propriedades.
Nota: Consulte o Guia de administração e do usuário do PPDM para obter mais detalhes.
3. Como o cluster do Kubernetes já foi adicionado como uma origem de ativo na GUI do PPDM, uma detecção manual do cluster do Kubernetes é necessária após a etapa 1 ou 2 ser verificada/executada.
受影响的产品
PowerProtect Data Manager文章属性
文章编号: 000190024
文章类型: Solution
上次修改时间: 27 8月 2022
版本: 6
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。