CSM: Driver CSI per PowerFlex CrashLoopBackOff a causa del timeout di accesso al gateway
Riepilogo: Questo problema riguarda i moduli CSM (Container Storage Module) Dell con il driver CSI (Dell Container Storage Interface) per PowerFlex. Quando l'accesso al gateway PowerFlex supera un timeout hardcoded di 1 secondo, il driver non riesce a eseguire le probazioni. ...
Sintomi
I registri dei driver mostrano un timeout di 1 secondo:
time="2026-05-15T17:14:29Z" level=info msg="Login to PowerFlex Gateway, system=<array id>, endpoint=https://<gateway>, user=<user>\n" time="2026-05-15T17:14:30Z" level=error msg="array <array id> probe failed: rpc error: code = FailedPrecondition desc = unable to login to PowerFlex Gateway: Get \"https://<gateway>/api/login\": context deadline exceeded"
I pod possono essere visualizzati in un CrashLoopBackOff o stato di errore.
oc get pods -n vxflexos ... vxflexos-node-xxxxx 1/2 Error 442 (5m22s ago) 19h vxflexos-node-xxxxx 0/2 CrashLoopBackOff 431 (103s ago) 18h
Le modifiche recenti possono includere aggiornamento, latenza di rete, problemi di prestazioni del gateway o dimensionamento del cluster.
Causa
Il driver CSI per le versioni 2.13.1 e 2.14.0 del driver PowerFlex utilizza un timeout della sonda non configurabile. La chiamata di accesso a PowerFlex Gateway supera questo timeout.
Risoluzione
Il reparto Engineering ha apportato una modifica per rendere il timeout della sonda configurabile nelle versioni successive del driver CSI (Container Storage Interface) per PowerFlex. Eseguire l'aggiornamento a una versione in cui il timeout di probe è configurabile.
In base alle note di rilascio, questo problema è stato risolto nelle seguenti versioni:
https://github.com/dell/csi-powerflex/releases (Link esterno)
- 2.13.2
- 2.14.1
- 2.15.0 o versioni successive
- 2.16.0 o versioni successive
Dopo l'aggiornamento, configurare probe timeout X_CSI_PROBE_TIMEOUT in base alle esigenze dell'ambiente. L'impostazione predefinita è ora di 10 secondi.