응답을 중지한 가상 머신 문제 해결
Summary: 이 문서에서는 vSphere 가상 머신이 응답하지 않는 가능한 원인을 격리하는 단계를 제공합니다.
Instructions
목표
이 문서에서는 vSphere 가상 머신이 응답하지 않는 가능한 원인을 격리하는 단계를 제공합니다.
응답하지 않는 가상 머신은 연결 시도에 응답하지 않으며 전원을 껐다 켜려는 시도에 응답하지 못할 수 있습니다. 가상 머신이 응답하지 않는 상태가 되는 데는 여러 가지 이유가 있습니다. 이 문서를 사용하면 이러한 일반적인 원인을 식별하고 해결할 수 있으며, 해결되면 가상 머신을 작동 상태로 되돌릴 수 있습니다.
원인을 해결하지 않고 가상 머신의 하드 전원을 끌 수 있지만, 이렇게 하면 운영 중단의 근본 원인을 파악하는 데 도움이 될 수 있는 정보를 수집 및 분석할 수 없습니다.
사실
VMware ESX/ESXi에서 실행되는 가상 머신이 외부 입력에 응답하지 않거나 어떠한 작업도 나타내지 않습니다. 구체적인 내용은 다음과 같습니다.
-
게스트 OS가 콘솔의 키보드 또는 마우스 동작에 응답하지 않음
-
게스트 OS가 ping, RDP, SSH 등의 네트워크 통신에 응답하지 않습니다.
-
가상 머신 콘솔 화면이 정적이며 변경 또는 새로 고쳐지지 않음
-
가상 머신에서 수행된 작업이 실패하거나, 시간 초과되거나, 시작되지 않음
-
가상 머신이 네트워크 또는 디스크 트래픽을 생성하지 않음
솔루션
가상 머신이 제공하는 서비스는 가상 머신 내의 애플리케이션 또는 게스트 OS 문제, 가상 머신 모니터 또는 가상 디바이스 문제, 호스트의 리소스 경합, 기본 스토리지 또는 네트워킹 인프라스트럭처 문제 등 여러 가지 원인으로 인해 응답하지 않거나 연결할 수 없게 될 수 있습니다.
게스트 OS가 활동을 생성하는 경우 성공적으로 실행 중입니다. 이 경우 응답하지 않는 현상은 연결 문제 또는 리소스 경합으로 인해 발생하거나 게스트 OS 내에서 실행되는 애플리케이션 또는 서비스와 같은 상위 수준 구성 요소와 관련이 있을 수 있습니다.
범위를
확인합니다.정확한 증상과 문제의 범위를 이해하는 것이 중요합니다. 문제의 범위를 확인하려면 다음 검사를 수행합니다.
-
가상 머신이 실제로 응답하지 않는지 확인합니다. 가상 머신이 한 인터페이스를 통해서는 응답하지 않지만 다른 인터페이스에서는 올바르게 작동할 수 있습니다.
-
가상 머신의 전원이 켜져 있는지 확인합니다. 가상 머신의 전원이 예기치 않게 꺼진 경우 전원을 다시 켠 다음 예기치 않은 종료의 원인을 해결합니다.
-
이 문제가 여러 가상 머신에 영향을 미치는지 아니면 하나에만 영향을 미치는지 확인합니다. 여러 가상 머신이 영향을 받는 경우 잠재적 범위를 좁힐 때 영향을 받는 가상 머신 간의 유사점을 고려하십시오. 특히 영향을 받는 가상 머신 그룹이 의존하는 공유 인프라와 해당 공통 인프라에 종속된 모든 가상 머신이 영향을 받는지 여부에 초점을 맞춥니다.
-
게스트 OS가 가상 머신 콘솔의 상호 작용에 응답하는지 여부를 확인합니다. 문제가 게스트 OS 또는 가상 머신 내의 애플리케이션으로 격리되고 게스트 OS가 콘솔에서 응답하는 경우 콘솔에서 게스트 OS와 상호 작용하여 문제를 해결하십시오.
-
게스트 OS 또는 해당 애플리케이션 서비스가 네트워크를 통한 상호 작용에 응답하는지 여부를 확인합니다.
-
게스트 OS가 콘솔에 심각한 오류를 보고했으며 중지된 상태인지 확인합니다.
-
ESX/ESXi 호스트도 응답하지 않는지 확인합니다. 호스트도 응답하지 않는 경우 범위는 처음에 가정한 것보다 큽니다.
원인
파악:이 시점에서 하나 이상의 가상 머신이 가상 콘솔과 네트워크를 통해 응답하지 않음을 확인했습니다. 호스트 자체가 응답합니다. 리소스 액세스 가능성이나 경합 또는 기본 스토리지나 네트워킹 인프라스트럭처에 문제가 있을 수 있습니다.
원인을 식별하려면 다음을 수행합니다.
-
문제가 가상 머신에서 수행 중인 작업 또는 작업 때문에 트리거되었는지 확인합니다. 예를 들어, 스냅샷 및 vMotion 작업은 메모리 상태가 네트워크 또는 디스크에 복사되는 동안 잠시 동안 가상 머신을 중단시킵니다.
-
몇 가지 일반적인 구성 오류로 인해 가상 머신이 응답하지 않을 수 있습니다. 예를 들어 리소스를 기다리는 동안에는 가상 머신이 응답하지 않을 수 있습니다. 가상 머신 및 호스트 구성을 검토합니다.
-
가상 머신은 기능적 지원 인프라스트럭처에 의존합니다. 가상 머신이 의존하는 백업 스토리지 또는 네트워킹 인프라스트럭처에 문제가 있는 경우 가상 머신이 게스트 OS에 제공하는 가상 하드웨어가 영향을 받을 수 있습니다. 기본 스토리지 또는 네트워킹 문제를 해결합니다.
-
가상 머신은 사용 가능한 호스트 리소스(CPU, 메모리)에 종속되며 게스트 OS는 이러한 리소스를 사용합니다. 가상 머신 내부 또는 외부에서 리소스 가용성 또는 스케줄링에 문제가 발생하면 가상 머신이 응답하지 않을 수 있습니다. 가상 머신이 사용할 수 없는 리소스를 차단하거나 100% vCPU 사용률로 회전할 수도 있습니다.
실행 계획:
이 시점에서 가상 머신을 실행하는 호스트가 응답하고 공유 스토리지 또는 네트워킹 인프라 문제가 발생하지 않음을 확인했습니다. 게스트 OS가 심각한 오류로 인해 실패하지는 않았지만 가상 머신 콘솔 및 네트워크를 통해 응답하지 않습니다.
다음과 같은 것으로 의심되는 아키텍처 계층을 기반으로 응답하지 않는 가상 머신에 대한 정보를 복구하거나 수집하기 위한 조치를 취합니다.
-
문제가 게스트 OS로 격리된 경우 또는
%RUN상대적으로 높지만 가상 머신 모니터가 올바르게 작동하고 있으므로 가상 머신의 게스트 OS 또는 애플리케이션 내로 조사를 이동합니다. 게스트 OS는 물리적 하드웨어에서와 동일한 방식으로 가상 머신 내에서 응답하지 않을 수 있습니다.-
문제가 발생하는 동안 성능 데이터를 수집합니다.
-
내부 상태에 대한 추가 정보를 수집하기 위해 게스트 OS 내부에서 커널의 패닉을 수동으로 유도해 봅니다. 이러한 이벤트 중 하나에 대한 응답으로 게스트 OS에서 유용한 진단 정보를 생성하는 경우 게스트 OS 공급업체에 문의하여 자세히 조사합니다.
-
2단계에서 유용한 정보가 생성되지 않는 경우 가상 머신을 일시 중단하여 내부 상태에 대한 정보를 수집하고 VMware 지원 팀에 케이스를 개설합니다.
-
가상 머신을 일시 중단하고
.vmss상태 파일을 일시 중단합니다. -
가상 머신을 실행하는 호스트에서 로그를 수집합니다.
-
가상 머신의 전원을 다시 켠 다음 재설정합니다.
-
1단계, 3a단계, 3b단계에서 수집한 정보를 제공하여 VMware 지원에 문의합니다.
-
-
-
문제가 가상 머신 모니터로 격리된 경우 또는
%WAIT가 상대적으로 높거나 가상 머신을 일시 중단하려는 시도가 실패한 경우 성능 데이터를 수집하고 가상 머신을 강제로 충돌시켜 내부 상태에 대한 추가 정보를 수집합니다.-
문제가 발생하는 동안 성능 데이터를 수집합니다.
-
가상 머신을 충돌시켜 내부 상태에 대한 정보를 수집합니다.
참고: 가상 머신 충돌 시도가 실패하면 다음 섹션으로 건너뛰어 호스트 충돌을 시도합니다. -
1단계와 2단계에서 수집한 정보를 제공하여 VMware 지원 부서에 문의합니다.
-
-
문제가 가상 머신 모니터로 격리되었지만 가상 머신을 일시 중단하거나 충돌시키려는 시도가 실패하는 경우 이는 VMkernel에 문제가 있음을 반영합니다. 호스트에서 로그 번들을 수집하고, 영향을 받지 않는 모든 가상 머신을 호스트에서 제거하고, NMI를 사용하여 의도적으로 보라색 진단 화면을 생성합니다.
-
문제가 발생하는 동안 성능 데이터를 수집합니다.
-
vMotion을 사용하여 영향을 받지 않는 모든 가상 머신을 호스트에서 이동합니다. 가능한 경우 유지 보수 모드를 사용하여 호스트에서 추가 가상 머신이 시작되지 않도록 합니다.
-
마스킹할 수 없는 인터럽트 수신 시 호스트를 패닉으로 구성한 다음 NMI를 실행하여 패닉을 트리거합니다.
-
호스트에서 자주색 진단 화면을 생성하고 진단 정보 덤프를 완료한 후 콘솔의 스크린샷 또는 사진을 찍고 호스트를 재시작합니다.
-
호스트에서 진단 정보를 수집합니다.
-
1단계, 4단계, 5단계에서 수집한 정보를 제공하여 VMware 지원 부서에 문의합니다.
-
관련 기사
VMware KB 1007819: https://kb.vmware.com/kb/1007819 
Additional Information
| VCE 시스템 | 모두 |
| 구성 요소 | vSphere |