Família de drivers da interface de armazenamento de contêineres: Quando um nó fica inativo, os volumes de block que estão conectados ao nó não podem ser conectados a outro nó

摘要: Quando um nó fica inativo (devido a uma falha de nó, cenário de desligamento do nó), os volumes de block conectados ao nó não podem ser conectados a outro nó.

本文适用于 本文不适用于 本文并非针对某种特定的产品。 本文并非包含所有产品版本。

症状

Quando um nó fica inativo (devido a uma falha de nó, cenário de desligamento do nó), os volumes de block conectados ao nó não podem ser conectados a outro nó. 

O problema é específico apenas para volumes de block.

O problema não é visto para volumes NFS.

O problema afeta os seguintes drivers:

  • Driver CSI para PowerFlex
  • Driver CSI para PowerMax
  • Driver CSI para PowerScale
  • Driver CSI para Unity

Esse problema não afeta o driver CSI do PowerStore.

O problema é relatado no GitHub nº 282 EtapasEsse hiperlink direcionará você para um site fora da Dell Technologies.

para reproduzir: 

  1. Crie um PVC1 e crie POD1.
  2. Verifique o nó em que o POD1 foi criado e desligue o nó do vSphere.
  3. Quando o nó não estiver pronto, tente excluir o POD1 (ele fica preso no estado de término, pois o nó não está pronto.)
  4. Tente criar o POD2 usando o mesmo PVC1. O POD2 está no estado de criação do contêiner com esse erro em descrever a saída.
Warning FailedAttachVolume 43s attachdetach-controller Multi-Attach error for volume "csivol-18eb3daee0" Volume is already used by pod(s) iscsipod1-p 

Resultado esperado: O POD deve ser excluído mesmo quando o nó não estiver pronto.

Resultado: O POD está preso no estado de terminação devido ao nó não pronto.

A saída abaixo mostra o pod original terminando e o novo pod travado em Criação de contêiner:

kubectl get pods -o wide

NAME        READY STATUS            RESTARTS AGE   IP     NODE    NOMINATED NODE READINESS GATES
iscsipod1-p 1/1   Terminating       0        9m43s              
iscsipod2-p 0/1   ContainerCreating 0        55s              


O seguinte comando mostra que o nó não está pronto:

kubectl get nodes

NAME  STATUS   ROLES                AGE  VERSION
Node1 Ready    control-plane,master 163d v1.23.0
Node2 Ready                   162d v1.23.0
Node3 NotReady               162d v1.23.0


O seguinte comando mostra que o PVC ainda está vinculado ao PV:

kubectl get pvc -n 

NAME STATUS VOLUME CAPACITY ACCESS MODES STORAGECLASS AGE
iscsipvc1-p Bound csivol-18eb3daee0 5Gi RWO powerstore-iscsi 10m


O seguinte comando mostra o aviso:

kubectl describe pod -n 

...
node.kubernetes.io/unreachable:NoExecute op=Exists for 300s
Events:
Type Reason Age From Message
---- ------ ---- ---- -------
Normal Scheduled 108s default-scheduler Successfully assigned default/iscsipod2-p to lglw3178
Warning FailedAttachVolume 108s attachdetach-controller Multi-Attach error for volume "csivol-18eb3daee0" Volume is already used by pod(s) iscsipod1-p

原因

A causa raiz é que o sidecar do conectador não consegue enviar ControllerUnpublishVolume() para o nó que ficou inativo. Consulte as informações contidas no GitHub nº 215 Esse hiperlink direcionará você para um site fora da Dell Technologies.

解决方案

Solução temporária:
  1. Force a exclusão do pod que estava em execução no nó que ficou inativo.
kubectl delete po  --force --grace-period=0
  1. Exclua o anexo de volume ao nó que ficou inativo.
kubectl delete volumeattachment 

O volume agora pode ser conectado ao novo nó.

Resolução:
 Essa solução será atualizada quando uma correção for lançada.
文章属性
文章编号: 000200778
文章类型: Solution
上次修改时间: 07 7月 2023
版本:  8
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。