Поди вузла CSM PowerFlex застрягли на init:0/2
Summary: Модулі зберігання контейнерів (CSM) вузли PowerFlex зависли на init:0/2 після того, як хости були перезавантажені через деякі зміни, застосовані до них.
Symptoms
Усі вузлові блоки PowerFlex застрягли на init:0/2 і повідомлено про помилку "Warning FailedMount 8s (x6 over 23s) kubelet MountVolume.SetUp failed for volume "scaleio-path-bin" : mkdir /bin/emc: read-only file system " в описі стручка.
Проблема виникла з CSM Operator 1.9 і 1.8.1 із драйвером інтерфейсу зберігання контейнерів (CSI) для PowerFlex 2.13.1 і 2.14.
Cause
Основна причина цієї проблеми полягає в тому, що оператор CSM не може визначити, чи працює він у середовищі OpenShift під час ініціалізації. Він кешує цю інформацію для подальшого використання. Цілком ймовірно, що в момент запуску оператора наступна команда не повернула очікуваний результат:
oc get --raw /apis | jq | grep "security.openshift.io"
Це говорить про те, що security.openshift.io Група інтерфейсів прикладного програмування (API) могла бути недоступною на той момент.
У журналі оператора, якщо ви бачите [isOpenShift err false], це означає, що оператор не може визначити середовище OpenShift.
2025-06-17T08:45:38.167Z INFO workspace/main.go:99 isOpenShift err false {"TraceId": "main"}2025-06-17T08:45:38.168Z INFO workspace/main.go:105 Kubernetes environment {"TraceId": "main"}
Правильне повідомлення журналу для визначення середовища OpenShift:
2025-06-19T00:03:14.913Z INFO workspace/main.go:138 Openshift environment {"TraceId": "main"}
Resolution
- Вручну виконайте наступну команду:
oc get --raw /apis | jq | grep "security.openshift.io"
and
oc auth can-i get /apis/security.openshift.io --as=system:serviceaccount:dell-csm-operator:dell-csm-operator-manager-service-account
- Очікуваний результат
# oc get --raw /apis | jq | grep "security.openshift.io" "name": "security.openshift.io", "groupVersion": "security.openshift.io/v1", "groupVersion": "security.openshift.io/v1",
# oc auth can-i get /apis/security.openshift.io --as=system:serviceaccount:dell-csm-operator:dell-csm-operator-manager-service-accountyes
3. Якщо ви бачите висновок вище, то перезапустіть оператор CSM:
oc delete pod dell-csm-operator-controller-manager-xxx-xxx -n openshift-operators
4. Якщо результат не збігається з вищезазначеним, попросіть клієнта звернутися до служби підтримки Red Hat для подальшої перевірки.