CSM PowerFlex-nodepods sidder fast ved init:0/2
Summary: Container Storage Modules (CSM) PowerFlex-nodepods sidder fast på init:0/2, efter værter blev genstartet på grund af nogle ændringer, der er anvendt på dem.
Symptoms
Alle PowerFlex-nodepods sidder fast ved init:0/2 og rapporterede fejl "Warning FailedMount 8s (x6 over 23s) kubelet MountVolume.SetUp failed for volume "scaleio-path-bin" : mkdir /bin/emc: read-only file system " i pod beskrivelse.
Problemet opstod med CSM Operator 1.9 og 1.8.1 med CSI-driver (Container Storage Interface) til PowerFlex 2.13.1 og 2.14.
Cause
Den grundlæggende årsag til dette problem er, at CSM-operatoren ikke kan afgøre, om den kører i et OpenShift-miljø under initialiseringen. Det cachelagrer disse oplysninger til senere brug. Det er sandsynligt, at følgende kommando på tidspunktet for operatørstart ikke returnerede det forventede resultat:
oc get --raw /apis | jq | grep "security.openshift.io"
Dette tyder på, at security.openshift.io API-gruppen (Application Programming Interface) var muligvis ikke tilgængelig på det pågældende tidspunkt.
Hvis du kan se i operatørlogfilen [isOpenShift err false], betyder det, at operatøren ikke kan bestemme OpenShift-miljøet.
2025-06-17T08:45:38.167Z INFO workspace/main.go:99 isOpenShift err false {"TraceId": "main"}2025-06-17T08:45:38.168Z INFO workspace/main.go:105 Kubernetes environment {"TraceId": "main"}
Den korrekte logmeddelelse til bestemmelse af OpenShift-miljøet er:
2025-06-19T00:03:14.913Z INFO workspace/main.go:138 Openshift environment {"TraceId": "main"}
Resolution
- Kør følgende kommando manuelt:
oc get --raw /apis | jq | grep "security.openshift.io"
and
oc auth can-i get /apis/security.openshift.io --as=system:serviceaccount:dell-csm-operator:dell-csm-operator-manager-service-account
- Det forventede resultat er
# oc get --raw /apis | jq | grep "security.openshift.io" "name": "security.openshift.io", "groupVersion": "security.openshift.io/v1", "groupVersion": "security.openshift.io/v1",
# oc auth can-i get /apis/security.openshift.io --as=system:serviceaccount:dell-csm-operator:dell-csm-operator-manager-service-accountyes
3. Hvis du ser ovenstående output, skal du genstarte CSM-operatoren:
oc delete pod dell-csm-operator-controller-manager-xxx-xxx -n openshift-operators
4. Hvis outputtet ikke er det samme som ovenfor, skal du bede kunden om at kontakte Red Hat-support for at kontrollere yderligere.