Dell Unity: Jak shromáždit potřebné informace pro analýzu výkonu polí Unity
Summary: Tento článek popisuje, jak shromažďovat protokoly a data pro diagnostiku problémů s výkonem v polích Unity.
Instructions
Problém
-
Slabý výkon čtení a zápisu (nebo obojího) a vysoká doba odezvy u připojených hostitelů.
-
Doba odezvy hostitelských aplikací se zvýšila nebo je nepřijatelně vysoká.
-
Problémy s výkonem u polí Dell Unity, které vyžadují analýzu výkonu.
Problémy s výkonem mohou mít řadu příčin. Patří mezi ně: konfigurace sítě, zahlcení, konfigurace hostitele, chyb hardwaru, konfliktu disku (několik vytížených jednotek LUN, které sdílejí stejné jednotky) nebo maximální využití diskového pole.
Technická podpora Unity nebude moci plně prozkoumat a odstranit problémy s výkonem, dokud neposkytnete následující informace:
- Soubor servisních dat (kolekce dat)
- Soubory UPA (Unity Performance Archives)
- Podrobný popis příznaků, které se vyskytují ve výrobním prostředí
Pokud tyto informace uvedené v článku znalostní databáze Dell neposkytnete okamžitě, může to mít za následek delší dobu řešení.
Podrobnosti o problémech s výkonem (příznaky, časová razítka atd.) jsou zásadní, aby technik zjistil, na co se zaměřit (časy / jednotky LUN / hostitelé atd.), a nevěnoval několik hodin hledání problému (namísto příčiny). Bez těchto podrobností můžeme strávit hodiny hledáním problému a analyzovat pouze obecné statistiky výkonu.
Rozsah
Služby podpory Dell EMC zkoumají případy výkonu a určují problémy, se kterými se zákazník na pracovišti potýká. Ladění výkonu (pro dosažení špičkového výkonu hostitele nebo aplikace) a opětovná konfigurace je úkol pro správce úložiště nebo architekta řešení, takže to nebude řešeno v požadavku na opravu závad.
Servisní požadavky, které nemají skutečný problém, například vyžádání zprávy o aktuální úrovni pracovního zatížení v poli, nespadají do rozsahu podpory provádění oprav. Uživatelé, kteří potřebují pomoc s určením úrovně pracovního zatížení pole, mohou použít službu LiveOptics. Podrobné informace o této možnosti naleznete v následujícím článku znalostní databáze:
Požadavky na data a informace pro podrobnou analýzu výkonu
Pro každou událost potřebuje technická podpora následující protokoly a informace, které pokrývají období incidentu:
- Soubory servisních dat (známé také jako kolekce dat) vygenerované krátce po výskytu tohoto problému.
- Pokud se používá replikace, budou potřeba kolekce dat a soubory UPA z obou polí.
- Soubory Unity UPA (Unity Performance Archives), které pokrývají celé období, kdy k problému docházelo.
- Pokud se zdá, že se problémy netýkají pole, mohou být vyžadována také data Grab hostitele a protokoly přepínače.
- Může být také vyžadováno trasování sítě Unity.
PROBLÉMY S BLOKOVÁNÍM
- Uveďte jasný a podrobný popis problému:
- Kdy se problém vyskytl? (Datum, čas a časové pásmo)
- Které jednotky LUN jsou dotčeny?
- To je důležité pro zúžení vyhledávání.
- Je u jednotek LUN, u kterých dochází k problémům, povolena funkce Data Reduction nebo Advanced Deduplication? Je funkce Data Reduction povolena pro jiné jednotky LUN? (Viz dokument whitepaper se vzorovými postupy Unity – využití procesoru, strana 9)
- Používá se replikace? Uveďte informace o RPO pro replikaci a o tom, zda se problém s výkonem zlepší, pokud je replikace pozastavena.
- Jsou nebo byla někdy aktivní data nedostupná?
- Běží v zadaném čase ještě nějaká úloha? (Zálohování, úlohy, dávkové úlohy, kontroly virů, optimalizace hostitelského disku (TRIM/UNMAP) atd.)
- Pokud něco nefunguje tak, jak by mělo, fungovalo to někdy? Nebo se jedná o součást nové implementace/nastavení? Přidali jste nedávno nějaké nové aplikace nebo hostitele?
- Jak měříte výkon nebo jak je výkon ovlivněn? Dochází na straně hostitele k prodlevám či chybám? Hlásí koncoví uživatelé pomalý výkon?
- Došlo v nedávné době k nějakým změnám v prostředí SAN (hostitelé, přepínače, pole)?
- Dopad (dotčené aplikace, počet dotčených serverů, počet dotčených uživatelů atd.)
- Jak často k problému dochází? (nepřetržitě/pravidelně/jednorázově/náhodně)
- Jaké jsou názvy dotčených hostitelů?
- Jaká topologie se používá? FC, iSCSI nebo Ethernet? (Pokud používají iSCSI, MUSÍ mít všichni hostitelé vypnutou funkci TCP Delayed ACK.
- Pokud se problém může týkat konektivity, pravděpodobně bude podpora potřebovat schéma topologie.
- Vyskytuje se v síti současně známý problém nebo byla síť nedávno upgradována? Zkontrolujte také, že se protokol iSCSI nepoužívá v interní síti LAN a že se používají pouze přepínače podnikové třídy.
PROBLÉMY SE SOUBORY
- Uveďte jasný a podrobný popis problému:
- Jaké konkrétní protokoly používáte?
- Příklad: NFS (verze), CIFS (verze), NDMP, iSCSI, FTP atd.
- Souvisí problém s konkrétním exportem / sdílenou složkou, systémem souborů / jednotkou LUN?
- V jaké denní době k problému dochází? (Datum, čas a časové pásmo)
- Jaké je v té době aktivní pracovní zatížení?
- Příklad: přihlášení, odhlášení, zálohování, dávkové úlohy atd.
- Kterých hostitelů se to týká?
- Příklad: Zálohy, virtuální počítače, pracovní stanice, servery atd.?
- Konkrétní podrobnosti o aplikaci.
- Jak vypadá konfigurace sítě?
- Uveďte podrobnosti o konkrétním rozhraní / síťové kartě.
- Jsou síťová rozhraní izolována na samostatných síťových kartách?
- Příklad: Provoz replikace na vyhrazené síťové kartě
Shromažďování souborů servisních dat (kolekce dat)
Chcete-li získat soubor servisních dat (kolekci dat), přečtěte si článek LKB 000023676. K zobrazení podrobné konfigurace pole a všech událostí, které se vyskytly v poli, budou nezbytné výstupní soubory ze souboru servisních dat v poli. Podpora zákazníkům doporučuje shromáždit soubor servisních dat (kolekci dat) co nejdříve po výskytu události.
Nezapomeňte, že soubor servisních dat bude obsahovat pouze poslední kompletní soubor UPA (s pokrytím jedné hodiny) a jakýkoli dostupný -tmp.archive soubor UPA. Často tyto informace nestačí k řádné kontrole výkonu a budou vyžadovány další soubory UPA.
Chcete-li najít soubor UPA v souboru servisních dat (kolekci dat), přejděte do spx\cmd_outputs\metrics\
-
spx= Primární SP -
Příklad: Pokud je SPA aktivním SP, UPA je pod
spa\cmd_outputs\metrics
Shromažďování souborů UPA
- Podpora může požádat o další soubory UPA.
- Na rozdíl od souboru servisních dat (kolekce dat) se v poli ukládají soubory UPA s pokrytím až 48 hodin.
- Soubory UPA vypadají jako v následujícím příkladu. Každý název souboru obsahuje datum a čas prvního datového bodu v souboru. Interval je 10 sekund a pokrývá jednu hodinu minus 10 sekund. Datum a čas v názvech souborů jsou v časovém pásmu UTC/GMT.
- Poslední soubor UPA v příkladu níže představuje nejaktuálnější archiv (
-tmp.archive). Obsahuje aktuální data o výkonu a je možné je zkopírovat z pole (pouze prostřednictvím SSH/CLI), a zobrazit tak nejaktuálnější data. Podpora může tento soubor použít k zobrazení událostí výkonu, aniž by se muselo čekat na další hodinu.
- Poslední soubor UPA v příkladu níže představuje nejaktuálnější archiv (
Příklad souborů UPA uložených v poli Dell Unity:01/05/2017 10:59 AM 11,017,216 _default_20170105_150000.archive
01/05/2017 11:59 AM 11,017,216 _default_20170105_160000.archive
01/05/2017 01:00 PM 11,017,216 _default_20170105_170000.archive
01/05/2017 01:59 PM 10,983,424 _default_20170105_180000.archive
01/05/2017 02:45 PM 8,308,736 _default_20170105_190000-tmp.archive
1. možnost: Seznam Unisphere
Tato možnost je k dispozici pouze pro prostředí Unity OE verze 4.2 a vyšší. Nemusí zde být uvedeny všechny dostupné soubory UPA. Uživatelské rozhraní (Unisphere) je omezené a lze zobrazit jen některé dostupné soubory. Pokud požadovaný soubor UPA není uvedený, přejděte ke 2. možnosti nebo použijte SSH/CLI.
2. možnost: Časový rozsah Unisphere
- Můžete vybrat časový rozsah, ze kterého má systém stáhnout dostupné soubory UPA.
- Před shromážděním protokolů potvrďte čas výskytu problému, aby se stáhly pouze nezbytné protokoly.
- Nezapomeňte, že časový rozsah zákazníka je uveden v místním čase prohlížeče, který je často stejný jako aktuální čas pracovní stanice.
- Tato možnost je k dispozici pouze pro prostředí Unity OE 4.2 a vyšší

Použití rozhraní SSH/CLI
Pomocí příkazového řádku se dá také získat přístup k dalším souborů UPA, které jsou v poli Unity (ale nejsou uvedeny v uživatelském rozhraní Unisphere) podle 1. možnosti.
-
Přihlaste se pomocí servisního uživatele a servisního hesla
-
Zkopírujte požadované protokoly do
/cores/service/userz/EMC/backend/metricsluna1/archives -
Stáhněte si tyto protokoly prostřednictvím WinSCP nebo podobného nástroje
-
Pokud je pole v prostředí OE 4.5.X nebo novějším, změňte protokol souborů na SCP
-
Přihlaste se pomocí servisního uživatele a servisního hesla
-
ll /EMC/backend/metricsluna1/archives/
cp /EMC/backend/metricsluna1/archives/_default_20230221_180000.archive.gz /cores/service/user
Poznámka: Pokud shromažďujete pouze aktuální soubory UPA, doporučujeme použít koncovku |tail-10, jelikož na backendu jsou k dispozici desítky souborů UPA. Můžete je však zobrazit všechny.

Kolekce dat hostitele
Pokud se problém týká určitých hostitelů, mohou být zapotřebí výstupní soubory Grab hostitele (nebo EMC Report).
-
Přejděte na adresu https://www.dell.com/support/home/ (web podpory společnosti Dell) a vyhledejte nástroj Grab Utility pro správný hostitelský operační systém (například: ESXi Host Grab)
-
Stáhněte si nástroj a soubor README.
-
Podle pokynů v souboru README spusťte nástroj pro vybraný operační systém hostitele.
Protokoly přepínačů
Pokud k problému s výkonem dochází pouze u určitých cest, mohou být vyžadovány protokoly přepínače. Pokyny (podle používaného modelu) naleznete v následujícím článku LKB:
Brocade/Connectrix
Záznamy trasování sítě (výpis TCP)
Některé problémy s výkonem souborů mohou souviset se sítí. Za účelem úplného určení příčiny problému může podpora vyžadovat trasování sítě.
Dell Unity: Zachycení trasování sítě TCP/IP z pole (oprava uživatelem)