APEX Cloud Platform for Red Hat OpenShift: Contêiner de pod aguardando mais de 1 hora no namespace openshift-marketplace
Summary: Caso inicial do Dail com o evento "Pod container waiting longer than 1 hour" no namespace openshift-marketplace
Symptoms
Um caso dial-home é criado para o código de evento do OpenShift: 1038CLST0005, o evento menciona o contêiner do pod aguardando mais de 1 hora no namespace openshift-marketplace
Cause
A causa é um bug conhecido no OpenShift Container Platform 4.10-4.13
Resolution
De acordo com o Red Hat KCS 7016065, a solução atual é fazer upgrade para o OpenShift Container Platform 4.14+.
NOTA: Um 7011359 mais antigo do Red Hat KCS tinha uma solução temporária, mas causou problemas e foi removido - agora está encaminhando para o KCS 7016065.
Para um cliente que não pode fazer upgrade para a versão 4.14, siga esta solução temporária:
1) Ignore o evento 1038CLST0005 para o namespace openshift-marketplace se a versão do OCP for 4.10 a 4.13.
2) Podemos silenciar o evento no namespace openshift-marketplace.
- Vá para Observar ->Alertas ->Silêncios
- Clique em Create silence
- Em Duração, em "Para...", selecione "-" e edite "Até..." (mude para uma hora futura para que não haja alertas KubeContainerWaiting para o servidor de registro do contêiner)
- Adicione rótulos "alertname=KubeContainerWaiting", "namespace=openshift-marketplace", "container=registry-server" (se você não adicionar contêiner, ele silenciará o alerta para todos os pods no namespace "openshift-marketplace")

Additional Information
Este artigo da KB é apenas para eventos no namespace openshift-marketplace , se o evento e o dial home forem para pods em outro namespace, não silencie o alerta e solucione problemas conforme necessário.