PowerProtect: O backup do Kubernetes apresentou falha com o erro "controller pod is not running"
Summary: O backup do PPDM Kubernetes apresentou falha com o erro "controller pod is not running"
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
Na instância em que isso foi observado, todos os backups do PPDM Kubernetes começaram a falhar após a recuperação do PPDM a partir do backup de recuperação de desastres do servidor. No entanto, isso pode ocorrer em outra situação.
O backup do Kubernetes apresentou falha com o erro "controller pod is not running".
O erro abaixo pode ser observado nos logs:
2021-07-21T03:49:48.340Z ERROR [] [task-5011a057-340f-40fb-8cd8-12414685d058] [][][][TRACE_ID:a66ce529604914ad;JOB_ID:a9b8915af1637407][] [K8sHelperApi.isDone(90)] - Failed to wait on job com.emc.dpsg.ecdm.baseresourceservice.exception.ValidationServiceException: controller pod is not running
2021-07-21T03:50:14.065Z WARN [] [dsSource-plpd-testcluster] [][][][][] [c.e.b.c.s.p.K8sHealthMonitor.checkPodHealth(200)] - Controller Pod is down, cluster:
Saída do comando kubectl describe pod -n powerprotect para esse cluster k8s:
powerprotect powerprotect-controller-666ffccbbf-p5rwh 0/1 ImagePullBackOff 0 6d12h
velero-ppdm backup-driver-587cfcdf59-2mc8p 1/1 Running 0 49d
velero-ppdm velero-5df5fcd896-p68rw 1/1 Running 0 49d
O backup do Kubernetes apresentou falha com o erro "controller pod is not running".
O erro abaixo pode ser observado nos logs:
2021-07-21T03:49:48.340Z ERROR [] [task-5011a057-340f-40fb-8cd8-12414685d058] [][][][TRACE_ID:a66ce529604914ad;JOB_ID:a9b8915af1637407][] [K8sHelperApi.isDone(90)] - Failed to wait on job com.emc.dpsg.ecdm.baseresourceservice.exception.ValidationServiceException: controller pod is not running
2021-07-21T03:50:14.065Z WARN [] [dsSource-plpd-testcluster] [][][][][] [c.e.b.c.s.p.K8sHealthMonitor.checkPodHealth(200)] - Controller Pod is down, cluster:
Saída do comando kubectl describe pod -n powerprotect para esse cluster k8s:
powerprotect powerprotect-controller-666ffccbbf-p5rwh 0/1 ImagePullBackOff 0 6d12h
velero-ppdm backup-driver-587cfcdf59-2mc8p 1/1 Running 0 49d
velero-ppdm velero-5df5fcd896-p68rw 1/1 Running 0 49d
Cause
O pod do controlador do PowerProtect não consegue obter a imagem necessária da Internet.
Resolution
1. Verifique se o cluster do Kubernetes pode acessar o hub do Docker em https://hub.docker.com/ e o Quay em https://quay.io/ para obter as imagens necessárias.
2. Se um cluster do Kubernetes não puder acessar esses locais devido a firewall ou outras restrições, você poderá extrair essas imagens para um registro local que o cluster possa acessar. Siga o procedimento abaixo.
1). Crie um arquivo application.properties /usr/local/brs/lib/cndm/config/application.properties
no equipamento PowerProtect Data Manager com o seguinte conteúdo:
k8s.docker.registry=fqdn:port Por exemplo, k8s.docker.registry=artifacts.example.com:8446
k8s.image.pullsecrets=secret resource name Especifique essa entrada somente se você exigir uma senha para a extração de imagem.
2). Execute cndm restart para aplicar as propriedades.
Nota: Consulte o Guia de administração e do usuário do PPDM para obter mais detalhes.
3. Como o cluster do Kubernetes já foi adicionado como uma origem de ativo na GUI do PPDM, uma detecção manual do cluster do Kubernetes é necessária após a etapa 1 ou 2 ser verificada/executada.
2. Se um cluster do Kubernetes não puder acessar esses locais devido a firewall ou outras restrições, você poderá extrair essas imagens para um registro local que o cluster possa acessar. Siga o procedimento abaixo.
1). Crie um arquivo application.properties /usr/local/brs/lib/cndm/config/application.properties
no equipamento PowerProtect Data Manager com o seguinte conteúdo:
k8s.docker.registry=fqdn:port Por exemplo, k8s.docker.registry=artifacts.example.com:8446
k8s.image.pullsecrets=secret resource name Especifique essa entrada somente se você exigir uma senha para a extração de imagem.
2). Execute cndm restart para aplicar as propriedades.
Nota: Consulte o Guia de administração e do usuário do PPDM para obter mais detalhes.
3. Como o cluster do Kubernetes já foi adicionado como uma origem de ativo na GUI do PPDM, uma detecção manual do cluster do Kubernetes é necessária após a etapa 1 ou 2 ser verificada/executada.
Affected Products
PowerProtect Data ManagerArticle Properties
Article Number: 000190024
Article Type: Solution
Last Modified: 27 Aug 2022
Version: 6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.