Pody uzlů CSM PowerFlex zamrznou na init:0/2
Summary: Moduly CSM (Container Storage Modules) Pody uzlů PowerFlex zamrznou na úrovni init:0/2 po restartování hostitelů kvůli určitým změnám, které na ně byly použity.
Symptoms
Všechny pody uzlu PowerFlex se zaseknou na init:0/2 a nahlášené chyby "Warning FailedMount 8s (x6 over 23s) kubelet MountVolume.SetUp failed for volume "scaleio-path-bin" : mkdir /bin/emc: read-only file system " v popisu podu.
K problému došlo u operátorů CSM 1.9 a 1.8.1 s ovladačem CSI (Container Storage Interface) pro PowerFlex 2.13.1 a 2.14.
Cause
Hlavní příčinou tohoto problému je, že operátor CSM nedokáže během inicializace určit, zda je spuštěn v prostředí OpenShift. Tyto informace ukládá do mezipaměti pro pozdější použití. Je pravděpodobné, že v době spuštění operátoru následující příkaz nevrátil očekávaný výsledek:
oc get --raw /apis | jq | grep "security.openshift.io"
Z toho vyplývá, že security.openshift.io Skupina rozhraní API (Application Programming Interface) nemusí být v daném okamžiku k dispozici.
Pokud se v protokolu operátorů zobrazí [isOpenShift err false], znamená to, že obsluha není schopna určit prostředí OpenShift.
2025-06-17T08:45:38.167Z INFO workspace/main.go:99 isOpenShift err false {"TraceId": "main"}2025-06-17T08:45:38.168Z INFO workspace/main.go:105 Kubernetes environment {"TraceId": "main"}
Správná zpráva protokolu pro určení prostředí OpenShift je:
2025-06-19T00:03:14.913Z INFO workspace/main.go:138 Openshift environment {"TraceId": "main"}
Resolution
- Ručně spusťte následující příkaz:
oc get --raw /apis | jq | grep "security.openshift.io"
and
oc auth can-i get /apis/security.openshift.io --as=system:serviceaccount:dell-csm-operator:dell-csm-operator-manager-service-account
- Očekávaný výsledek je
# oc get --raw /apis | jq | grep "security.openshift.io" "name": "security.openshift.io", "groupVersion": "security.openshift.io/v1", "groupVersion": "security.openshift.io/v1",
# oc auth can-i get /apis/security.openshift.io --as=system:serviceaccount:dell-csm-operator:dell-csm-operator-manager-service-accountyes
3. Pokud se zobrazí výše uvedený výstup, restartujte operátor CSM:
oc delete pod dell-csm-operator-controller-manager-xxx-xxx -n openshift-operators
4. Pokud výstup není stejný jako výše, požádejte zákazníka, aby zapojil podporu Red Hat a provedl další kontrolu.