Řešení potíží s virtuálním počítačem, který přestal reagovat
Summary: Tento článek obsahuje postup pro izolaci možných příčin nereagování virtuálního počítače vSphere.
Instructions
Cíle
Tento článek obsahuje postup pro izolaci možných příčin nereagování virtuálního počítače vSphere.
Nereagující virtuální počítač nereaguje na žádné pokusy o připojení a nemusí být schopen reagovat na žádné pokusy o vypnutí a zapnutí. Existuje celá řada důvodů, proč může virtuální počítač skončit ve stavu, který nereaguje. Tento článek vám umožní identifikovat a vyřešit tyto běžné příčiny a po vyřešení vrátit virtuální počítač do provozního stavu.
Virtuální počítač je možné zcela vypnout bez odstranění příčiny, ale tím zabráníte shromažďování a analýze informací, které by mohly pomoci určit hlavní příčinu výpadku.
Fakta
Virtuální počítač spuštěný v systému VMware ESX/ESXi nereaguje na žádný externí vstup ani nevykazuje žádnou aktivitu. Konkrétně:
-
Hostovaný operační systém nereaguje na aktivitu klávesnice nebo myši na konzoli.
-
Hostovaný operační systém nereaguje na síťovou komunikaci, včetně pingu, RDP, SSH atd.
-
Obrazovka konzole virtuálního počítače je statická a nemění se ani neobnovuje
-
Úlohy prováděné na virtuálním počítači selžou, vyprší jejich časový limit nebo se nespustí.
-
Virtuální počítač nevytváří síťový nebo diskový provoz
Řešení
Služby, které virtuální počítač poskytuje, můžou přestat reagovat nebo být nedostupné z mnoha příčin, včetně problémů s aplikacemi nebo hostovaným operačním systémem v rámci virtuálního počítače, problémů s monitorem virtuálního počítače nebo virtuálními zařízeními, kolizí prostředků na hostiteli nebo problémů se základním úložištěm nebo síťovou infrastrukturou.
Pokud hostovaný operační systém vytváří nějakou aktivitu, je úspěšně spuštěný. V takovém případě je nereagování pravděpodobně způsobeno problémem s připojením nebo kolizemi prostředků nebo je specifické pro komponentu vyšší úrovně, jako je aplikace nebo služba spuštěná v hostovaném operačním systému.
Ověřte obor:
Je důležité mít přesné příznaky a rozumět rozsahu problému. Chcete-li potvrdit rozsah problému, projděte si tyto kontroly:
-
Ověřte, že virtuální počítač skutečně nereaguje. Je možné, že virtuální počítač nereaguje prostřednictvím jednoho rozhraní, ale funguje správně na jiných.
-
Ověřte, zda je virtuální počítač zapnutý. Pokud došlo k neočekávanému vypnutí virtuálního počítače, znovu jej zapněte a odstraňte příčinu neočekávaného vypnutí.
-
Zjistěte, zda se tento problém týká více virtuálních počítačů nebo pouze jednoho. Pokud je ovlivněno více virtuálních počítačů, zvažte při pokusu o zúžení potenciálního rozsahu podobnosti mezi ovlivněnými virtuálními počítači. Zaměřte se zejména na sdílenou infrastrukturu, na které závisí skupina ovlivněných virtuálních počítačů, a na tom, zda jsou ovlivněny všechny virtuální počítače závislé na této společné infrastruktuře.
-
Zjistěte, jestli hostovaný operační systém reaguje na interakci v konzole virtuálního počítače. Pokud byl problém izolován na hostovaný operační systém nebo aplikace ve virtuálním počítači a hostovaný operační systém na konzoli reaguje, vyřešte problém interakcí s hostovaným operačním systémem na konzole.
-
Určete, jestli hostovaný operační systém nebo jeho aplikační služby reagují na interakci prostřednictvím sítě.
-
Zjistěte, zda hostovaný operační systém nahlásil konzoli nějaké kritické chyby a je v zastaveném stavu.
-
Zjistěte, zda hostitel ESX/ESXi také nereaguje. Pokud hostitel také nereaguje, rozsah je větší, než se původně předpokládalo.
Identifikujte příčinu:
V tomto okamžiku jste zjistili, že jeden nebo více virtuálních počítačů nereaguje ve virtuální konzoli i prostřednictvím sítě. Samotný hostitel je responzivní. Může existovat problém s dostupností nebo kolizemi prostředků nebo se základní infrastrukturou úložiště nebo sítě.
Chcete-li zjistit příčinu:
-
Zjistěte, zda je problém vyvolán operací nebo úlohou prováděnou na virtuálním počítači. Například operace snapshot a vMotion ochromí virtuální počítač na krátkou dobu, zatímco se stav paměti kopíruje přes síť nebo na disk.
-
Některé běžné chyby konfigurace můžou vést k tomu, že virtuální počítač přestane reagovat, například při čekání na prostředek. Zkontrolujte konfiguraci virtuálního počítače a hostitele.
-
Virtuální počítače závisí na funkční záložní infrastruktuře. Pokud dojde k problému se záložním úložištěm nebo síťovou infrastrukturou, na které virtuální počítač závisí, může být ovlivněn virtuální hardware, který virtuální počítač prezentuje hostovanému operačnímu systému. Vyřešte základní problém s úložištěm nebo sítí.
-
Virtuální počítače závisí na dostupných prostředcích hostitele (procesor, paměť) a hostovaný operační systém tyto prostředky spotřebovává. Problém s dostupností prostředků nebo plánováním uvnitř nebo vně virtuálního počítače může způsobit, že přestane reagovat. Virtuální počítač může také blokovat nedostupné prostředky nebo se otáčet při 100% využití virtuálních procesorů.
Akční plán:
V tomto okamžiku jste zjistili, že hostitel, na kterém běží virtuální počítače, reaguje a nedochází k žádným problémům se sdíleným úložištěm nebo síťovou infrastrukturou. Hostovaný operační systém neselhal s kritickou chybou, ale nereaguje v konzoli virtuálního počítače a prostřednictvím sítě.
Podnikněte kroky k obnovení nebo shromáždění informací o nereagujícím virtuálním počítači na základě vrstvy architektury, která je podezřelá:
-
Pokud byl problém izolován na hostovaný operační systém nebo
%RUNje relativně vysoká, ale monitorování virtuálního počítače funguje správně, přesuňte šetření do hostovaného operačního systému nebo aplikací virtuálního počítače. Hostovaný operační systém může ve virtuálním počítači přestat reagovat stejným způsobem jako na fyzickém hardwaru:-
Shromažďujte data o výkonu, když problém probíhá.
-
Pokuste se ručně vyvolat paniku jádra v hostovaném operačním systému za účelem shromáždění dalších informací o jeho vnitřním stavu. Pokud hostovaný operační systém vytvoří užitečné diagnostické informace v reakci na jednu z těchto událostí, požádejte dodavatele hostovaného operačního systému, aby je dále prošetřil.
-
Pokud krok 2 neposkytuje užitečné informace, pozastavte virtuální počítač, aby se shromáždily informace o jeho vnitřním stavu, a otevřete případ u podpory VMware:
-
Pozastavte virtuální počítač a shromážděte
.vmssSoubor stavu pozastavení. -
Shromážděte protokoly z hostitele, na kterém běží virtuální počítač.
-
Znovu virtuální počítač zapněte a resetujte.
-
Obraťte se na podporu společnosti VMware a poskytněte informace shromážděné v krocích 1, 3a a 3b.
-
-
-
Pokud byl problém izolován na monitor virtuálního počítače nebo
%WAITje relativně vysoká nebo selhaly pokusy o pozastavení virtuálního počítače, shromážděte data o výkonu a vynuceně havarujte virtuální počítač, abyste shromáždili další informace o jeho vnitřním stavu:-
Shromažďujte data o výkonu, když problém probíhá.
-
Dojde k chybě virtuálního počítače, aby se shromáždily informace o jeho vnitřním stavu.
POZNÁMKA: Pokud se pokusy o selhání virtuálního počítače nezdaří, přejděte k další části a pokuste se o selhání hostitele. -
Obraťte se na podporu společnosti VMware a poskytněte informace shromážděné v krocích 1 a 2.
-
-
Pokud byl izolován problém na monitoru virtuálního počítače, ale pokusy o pozastavení nebo selhání virtuálního počítače selžou, odráží se to v problému s VMkernel. Shromážděte balíček protokolů z hostitele, evakuujte všechny neovlivněné virtuální počítače z hostitele a použijte NMI k záměrnému vygenerování fialové diagnostické obrazovky:
-
Shromažďujte data o výkonu, když problém probíhá.
-
Přesuňte všechny neovlivněné virtuální počítače z hostitele pomocí vMotion. Pokud je to možné, použijte režim údržby, abyste zabránili spuštění dalších virtuálních počítačů na hostiteli.
-
Nakonfigurujte hostitele tak, aby při přijetí nemaskovatelného přerušení zpanikařil, a poté vystavte NMI, aby spustil paniku.
-
Jakmile hostitel vygeneruje fialovou diagnostickou obrazovku a dokončí výpis diagnostických informací, pořiďte snímek obrazovky nebo fotografii konzole a restartujte hostitele.
-
Shromážděte diagnostické informace od hostitele.
-
Obraťte se na podporu společnosti VMware a poskytněte informace shromážděné v krocích 1, 4 a 5.
-
Související články
VMware KB 1007819: https://kb.vmware.com/kb/1007819 
Additional Information
| Systém VCE | Vše |
| Komponentní | vSphere |