CSM PowerFlex 노드 포드가 init:0/2에서 멈춤
Summary: CSM(Container Storage Module) 일부 변경 사항이 적용되어 호스트가 재부팅된 후 PowerFlex 노드 포드가 init:0/2에서 중단됩니다.
Symptoms
모든 PowerFlex 노드 포드가 init:0/2 및 보고된 오류 "Warning FailedMount 8s (x6 over 23s) kubelet MountVolume.SetUp failed for volume "scaleio-path-bin" : mkdir /bin/emc: read-only file system " Pod 설명에서 확인할 수 있습니다.
이 문제는 PowerFlex 2.13.1 및 2.14용 CSI(Container Storage Interface) 드라이버가 포함된 CSM Operator 1.9 및 1.8.1에서 발생했습니다.
Cause
이 문제의 근본 원인은 CSM Operator가 초기화 중에 OpenShift 환경에서 실행 중인지 확인할 수 없기 때문입니다. 나중에 사용할 수 있도록 해당 정보를 캐시합니다. 연산자 시작 시 다음 명령이 예상한 결과를 반환하지 않았을 수 있습니다.
oc get --raw /apis | jq | grep "security.openshift.io"
이는 security.openshift.io 해당 시점에 API(Application Programming Interface) 그룹을 사용할 수 없었을 수 있습니다.
연산자 로그에 [isOpenShift err false]이는 운영자가 OpenShift 환경을 확인할 수 없음을 의미합니다.
2025-06-17T08:45:38.167Z INFO workspace/main.go:99 isOpenShift err false {"TraceId": "main"}2025-06-17T08:45:38.168Z INFO workspace/main.go:105 Kubernetes environment {"TraceId": "main"}
OpenShift 환경을 파악하기 위한 올바른 로그 메시지는 다음과 같습니다.
2025-06-19T00:03:14.913Z INFO workspace/main.go:138 Openshift environment {"TraceId": "main"}
Resolution
- 다음 명령을 수동으로 실행합니다.
oc get --raw /apis | jq | grep "security.openshift.io"
and
oc auth can-i get /apis/security.openshift.io --as=system:serviceaccount:dell-csm-operator:dell-csm-operator-manager-service-account
- 예상 결과는 다음과 같습니다.
# oc get --raw /apis | jq | grep "security.openshift.io" "name": "security.openshift.io", "groupVersion": "security.openshift.io/v1", "groupVersion": "security.openshift.io/v1",
# oc auth can-i get /apis/security.openshift.io --as=system:serviceaccount:dell-csm-operator:dell-csm-operator-manager-service-accountyes
3. 위의 출력이 표시되면 CSM Operator를 다시 시작합니다.
oc delete pod dell-csm-operator-controller-manager-xxx-xxx -n openshift-operators
4. 출력이 위와 동일하지 않은 경우 고객에게 Red Hat 지원에 문의하여 자세히 확인하도록 요청하십시오.