Модули узла CSM PowerFlex зависают на init:0/2
Summary: Модули хранилища контейнеров (CSM) Модули узла PowerFlex зависают на init:0/2 после перезагрузки хостов из-за некоторых изменений, примененных к ним.
Symptoms
Все модули pod узла PowerFlex зависают в init:0/2 и сообщили об ошибке "Warning FailedMount 8s (x6 over 23s) kubelet MountVolume.SetUp failed for volume "scaleio-path-bin" : mkdir /bin/emc: read-only file system " в описании pod.
Проблема возникла с CSM Operator 1.9 и 1.8.1 с драйвером интерфейса хранилища контейнеров (CSI) для PowerFlex 2.13.1 и 2.14.
Cause
Основная причина этой проблемы заключается в том, что оператору CSM не удается определить, выполняется ли он в среде OpenShift во время инициализации. Эта информация кэшируется для последующего использования. Вероятно, в момент запуска оператора следующая команда не вернула ожидаемый результат:
oc get --raw /apis | jq | grep "security.openshift.io"
Это говорит о том, что security.openshift.io Группа интерфейса прикладного программирования (API) могла быть недоступна в данный момент.
Если в журнале оператора отображается сообщение [isOpenShift err false], это означает, что оператор не может определить OpenShift Environment.
2025-06-17T08:45:38.167Z INFO workspace/main.go:99 isOpenShift err false {"TraceId": "main"}2025-06-17T08:45:38.168Z INFO workspace/main.go:105 Kubernetes environment {"TraceId": "main"}
Правильное сообщение журнала для определения среды OpenShift:
2025-06-19T00:03:14.913Z INFO workspace/main.go:138 Openshift environment {"TraceId": "main"}
Resolution
- Вручную выполните следующую команду:
oc get --raw /apis | jq | grep "security.openshift.io"
and
oc auth can-i get /apis/security.openshift.io --as=system:serviceaccount:dell-csm-operator:dell-csm-operator-manager-service-account
- Ожидаемый результат:
# oc get --raw /apis | jq | grep "security.openshift.io" "name": "security.openshift.io", "groupVersion": "security.openshift.io/v1", "groupVersion": "security.openshift.io/v1",
# oc auth can-i get /apis/security.openshift.io --as=system:serviceaccount:dell-csm-operator:dell-csm-operator-manager-service-accountyes
3. Если вы видите приведенный выше вывод, перезапустите оператор CSM:
oc delete pod dell-csm-operator-controller-manager-xxx-xxx -n openshift-operators
4. Если выходные данные не совпадают с указанными выше, попросите заказчика обратиться в службу поддержки Red Hat для дальнейшей проверки.