Problemen oplossen met een virtuele machine die niet meer reageert

Summary: Dit artikel bevat stappen voor het isoleren van mogelijke oorzaken van het niet meer reageren van een virtuele vSphere-machine.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

Doelen
Dit artikel bevat stappen voor het isoleren van mogelijke oorzaken van het niet meer reageren van een virtuele vSphere-machine.

Een virtuele machine die niet reageert, reageert niet op verbindingspogingen en kan mogelijk niet reageren op pogingen om deze uit en weer in te schakelen. Er zijn verschillende redenen waarom een virtuele machine niet meer reageert. Met dit artikel kunt u deze veelvoorkomende oorzaken identificeren en oplossen, en de virtuele machine na oplossing weer operationeel maken.

Het is mogelijk om een virtuele machine uit te schakelen zonder de oorzaak op te lossen, maar dit voorkomt het verzamelen en analyseren van informatie die zou kunnen helpen bij het vaststellen van de hoofdoorzaak van de storing. 

Feiten
Een virtuele machine die wordt uitgevoerd op VMware ESX/ESXi reageert niet op externe invoer en vertoont geen activiteit. Specifiek:

  • Het gastbesturingssysteem reageert niet op toetsenbord- of muisactiviteit op de console

  • Het gastbesturingssysteem reageert niet op netwerkcommunicatie, inclusief ping, RDP, SSH, enz.

  • Het consolescherm van de virtuele machine is statisch en wordt niet gewijzigd of vernieuwd

  • Taken die worden uitgevoerd op de virtuele machine mislukken, krijgen een time-out of starten niet

  • Virtuele machine produceert geen netwerk- of schijfverkeer

Oplossing
De services die een virtuele machine levert, kunnen niet meer reageren of onbereikbaar zijn vanwege een aantal oorzaken, waaronder problemen met de applicaties of het gastbesturingssysteem in de virtuele machine, problemen met de monitor van de virtuele machine of virtuele apparaten, resourceconflicten op de host of problemen met de onderliggende storage- of netwerkinfrastructuur.
Als het gastbesturingssysteem activiteit produceert, wordt het met succes uitgevoerd. In dit geval is niet-responsiviteit waarschijnlijk te wijten aan een connectiviteitsprobleem of bronconflict, of is specifiek voor een component op een hoger niveau, zoals een applicatie of service die wordt uitgevoerd in het gastbesturingssysteem.

Valideer het bereik:
Het is belangrijk om nauwkeurige symptomen te hebben en inzicht te hebben in de omvang van een probleem. Om de omvang van het probleem te bevestigen, voert u deze controles uit:

  1. Controleer of de virtuele machine daadwerkelijk niet reageert. Het is mogelijk dat de virtuele machine niet reageert via de ene interface, maar correct functioneert op andere interfaces. 

  2. Controleer of de virtuele machine is ingeschakeld. Als de virtuele machine onverwacht is uitgeschakeld, schakelt u deze weer in en lost u de oorzaak van het onverwachte afsluiten op.

  3. Bepaal of dit probleem meerdere virtuele machines treft of slechts één. Als meerdere virtuele machines worden beïnvloed, moet u rekening houden met de overeenkomsten tussen de betrokken virtuele machines wanneer u probeert het potentiële bereik te beperken. Richt u met name op de gedeelde infrastructuur waarvan de groep betrokken virtuele machines afhankelijk is, en op de vraag of alle virtuele machines die afhankelijk zijn van die gemeenschappelijke infrastructuur worden beïnvloed. 

  4. Bepaal of het gastbesturingssysteem reageert op interactie via de console van de virtuele machine. Als een probleem is geïsoleerd voor het gastbesturingssysteem of applicaties binnen de virtuele machine en het gastbesturingssysteem reageert op de console, communiceer dan met het gastbesturingssysteem op de console om het probleem op te lossen. 

  5. Bepalen of het gastbesturingssysteem of de bijbehorende applicatieservices reageren op interactie via het netwerk.

  6. Bepaal of het gastbesturingssysteem kritieke fouten heeft gemeld aan de console en zich in een gestopte status bevindt.

  7. Bepaal of de ESX/ESXi-host ook niet reageert. Als de host ook niet reageert, is het bereik groter dan aanvankelijk werd aangenomen.


Identificeer de oorzaak:
Op dit punt hebt u vastgesteld dat een of meer virtuele machines niet reageren op zowel de virtuele console als via het netwerk. De host zelf is responsief. Er kan een probleem zijn met de toegankelijkheid of conflicten van bronnen, of met de onderliggende storage- of netwerkinfrastructuur.
Om de oorzaak te achterhalen:

  1. Bepaal of het probleem wordt veroorzaakt door een bewerking of taak die wordt uitgevoerd op de virtuele machine. Bij zowel snapshot- als vMotion-bewerkingen wordt een virtuele machine bijvoorbeeld gedurende korte tijd verdoofd terwijl de geheugenstatus via het netwerk of naar schijf wordt gekopieerd.

  2. Enkele veelvoorkomende configuratiefouten kunnen ertoe leiden dat een virtuele machine niet meer reageert, bijvoorbeeld tijdens het wachten op een resource. Controleer de configuratie van de virtuele machine en de host. 

  3. Virtuele machines zijn afhankelijk van een functionele ondersteunende infrastructuur. Als er een probleem is met de back-storage- of netwerkinfrastructuur waarvan de virtuele machine afhankelijk is, kan dit gevolgen hebben voor de virtuele hardware die een virtuele machine aan het gastbesturingssysteem presenteert. Los het onderliggende storage- of netwerkprobleem op.

  4. Virtuele machines zijn afhankelijk van beschikbare hostresources (CPU, geheugen) en het gastbesturingssysteem verbruikt deze resources. Een probleem met de beschikbaarheid of planning van resources binnen of buiten de virtuele machine kan ertoe leiden dat deze niet meer reageert. De virtuele machine blokkeert mogelijk ook niet-beschikbare resources of draait op 100% vCPU-gebruik. 


Actieplan:
Op dit punt hebt u vastgesteld dat de host waarop de virtuele machine(s) wordt uitgevoerd zowel responsief is als geen problemen met gedeelde opslag of netwerkinfrastructuur ondervindt. Het gastbesturingssysteem faalde niet met een kritieke fout, maar reageert nog steeds niet op de console van de virtuele machine en via het netwerk.
Onderneem actie om informatie te herstellen of te verzamelen over de niet-reagerende virtuele machine op basis van de architectuurlaag die verdacht is:

  • Als een probleem geïsoleerd is in het gastbesturingssysteem of het %RUN relatief hoog is, maar de monitor voor de virtuele machine correct werkt, verplaats het onderzoek naar het gastbesturingssysteem of de toepassingen van de virtuele machine. Een gastbesturingssysteem kan niet meer reageren in een virtuele machine op dezelfde manier als op fysieke hardware:

    1. Verzamel prestatiegegevens terwijl het probleem zich voordoet.

    2. Poging om handmatig een paniek van de kernel in het gastbesturingssysteem te veroorzaken om aanvullende informatie over de interne status te verzamelen. Als het gastbesturingssysteem nuttige diagnostische informatie produceert als reactie op een van deze gebeurtenissen, neemt u contact op met de leverancier van het gastbesturingssysteem om dit verder te onderzoeken.

    3. Als stap 2 geen nuttige informatie oplevert, onderbreekt u de virtuele machine om informatie over de interne status te verzamelen en opent u een case bij VMware Support:

      1. Onderbreek de virtuele machine en verzamel de .vmss Statusbestand opschorten.

      2. Verzamel logboeken van de host waarop de virtuele machine wordt uitgevoerd.

      3. Schakel de virtuele machine weer in en stel deze vervolgens opnieuw in.

      4. Schakel VMware Support in en verstrek de informatie die in stap 1, 3a en 3b is verzameld.

  • Als een probleem is geïsoleerd in de monitor van de virtuele machine of het %WAIT relatief hoog is, of pogingen om de virtuele machine te onderbreken zijn mislukt, worden prestatiegegevens verzameld en crasht de virtuele machine geforceerd om aanvullende informatie over de interne status te verzamelen:

    1. Verzamel prestatiegegevens terwijl het probleem zich voordoet.

    2. Laat de virtuele machine crashen om informatie over de interne status te verzamelen.

      OPMERKING: Als pogingen om de virtuele machine te laten crashen mislukken, gaat u naar het volgende gedeelte en probeert u de host te laten crashen.
    3. Schakel VMware Support in en verstrek de informatie die in stap 1 en 2 is verzameld.

  • Als een probleem geïsoleerd is in de Virtual Machine Monitor, maar pogingen om de virtuele machine te onderbreken of te laten crashen mislukken, duidt dit op een probleem met de VMkernel. Verzamel een logboekbundel van de host, evacueer alle niet-getroffen virtuele machines van de host en gebruik een NMI om opzettelijk een paars diagnostisch scherm te genereren:

    1. Verzamel prestatiegegevens terwijl het probleem zich voordoet.

    2. Verplaats alle niet-getroffen virtuele machines van de host met behulp van vMotion. Gebruik indien mogelijk de onderhoudsmodus om te voorkomen dat er extra virtuele machines op de host worden gestart.

    3. Configureer de host zodanig dat er een panic optreedt bij ontvangst van een niet-maskeerbare interrupt en geef vervolgens een NMI uit om een panic te activeren.

    4. Nadat de host een paars diagnostisch scherm heeft gegenereerd en de dump van diagnostische informatie heeft voltooid, maakt u een screenshot of foto van de console en start u de host opnieuw op.

    5. Diagnostische gegevens van de host verzamelen.

    6. Schakel VMware Support in en verstrek de informatie die in stap 1, 4 en 5 is verzameld.


Gerelateerde artikelen
VMware KB 1007819: https://kb.vmware.com/kb/1007819 Pictogram koppeling van derden

Additional Information

VCE-systeem Alle
Component vSphere

Products

VMware ESXi
Article Properties
Article Number: 000205776
Article Type: How To
Last Modified: 17 Dec 2024
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.