Dell Unity: Jak shromáždit potřebné informace pro analýzu výkonu polí Unity

Summary: Tento článek popisuje, jak shromažďovat protokoly a data pro diagnostiku problémů s výkonem v polích Unity.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

Problém

  • Slabý výkon čtení a zápisu (nebo obojího) a vysoká doba odezvy u připojených hostitelů.
  • Doba odezvy hostitelských aplikací se zvýšila nebo je nepřijatelně vysoká.
  • Problémy s výkonem u polí Dell Unity, které vyžadují analýzu výkonu.

Problémy s výkonem mohou mít řadu příčin. Patří mezi ně: konfigurace sítě, zahlcení, konfigurace hostitele, chyb hardwaru, konfliktu disku (několik vytížených jednotek LUN, které sdílejí stejné jednotky) nebo maximální využití diskového pole.

Technická podpora Unity nebude moci plně prozkoumat a odstranit problémy s výkonem, dokud neposkytnete následující informace:

  • Soubor servisních dat (kolekce dat)
  • Soubory UPA (Unity Performance Archives)
  • Podrobný popis příznaků, které se vyskytují ve výrobním prostředí

Pokud tyto informace uvedené v článku znalostní databáze Dell neposkytnete okamžitě, může to mít za následek delší dobu řešení.

Podrobnosti o problémech s výkonem (příznaky, časová razítka atd.) jsou zásadní, aby technik zjistil, na co se zaměřit (časy / jednotky LUN / hostitelé atd.), a nevěnoval několik hodin hledání problému (namísto příčiny). Bez těchto podrobností můžeme strávit hodiny hledáním problému a analyzovat pouze obecné statistiky výkonu.
 


Rozsah

Služby podpory Dell EMC zkoumají případy výkonu a určují problémy, se kterými se zákazník na pracovišti potýká. Ladění výkonu (pro dosažení špičkového výkonu hostitele nebo aplikace) a opětovná konfigurace je úkol pro správce úložiště nebo architekta řešení, takže to nebude řešeno v požadavku na opravu závad.

Servisní požadavky, které nemají skutečný problém, například vyžádání zprávy o aktuální úrovni pracovního zatížení v poli, nespadají do rozsahu podpory provádění oprav. Uživatelé, kteří potřebují pomoc s určením úrovně pracovního zatížení pole, mohou použít službu LiveOptics. Podrobné informace o této možnosti naleznete v následujícím článku znalostní databáze:

 
Požadavky na data a informace pro podrobnou analýzu výkonu

Pro každou událost potřebuje technická podpora následující protokoly a informace, které pokrývají období incidentu:

  • Soubory servisních dat (známé také jako kolekce dat) vygenerované krátce po výskytu tohoto problému.
    • Pokud se používá replikace, budou potřeba kolekce dat a soubory UPA z obou polí.
  • Soubory Unity UPA (Unity Performance Archives), které pokrývají celé období, kdy k problému docházelo.
  • Pokud se zdá, že se problémy netýkají pole, mohou být vyžadována také data Grab hostitele a protokoly přepínače.
  • Může být také vyžadováno trasování sítě Unity.


PROBLÉMY S BLOKOVÁNÍM

  • Uveďte jasný a podrobný popis problému:
  • Kdy se problém vyskytl? (Datum, čas a časové pásmo)
  • Které jednotky LUN jsou dotčeny?
    • To je důležité pro zúžení vyhledávání.
  • Je u jednotek LUN, u kterých dochází k problémům, povolena funkce Data Reduction nebo Advanced Deduplication? Je funkce Data Reduction povolena pro jiné jednotky LUN? (Viz dokument whitepaper se vzorovými postupy Unity – využití procesoru, strana 9)
  • Používá se replikace? Uveďte informace o RPO pro replikaci a o tom, zda se problém s výkonem zlepší, pokud je replikace pozastavena.
  • Jsou nebo byla někdy aktivní data nedostupná?
  • Běží v zadaném čase ještě nějaká úloha? (Zálohování, úlohy, dávkové úlohy, kontroly virů, optimalizace hostitelského disku (TRIM/UNMAP) atd.)
  • Pokud něco nefunguje tak, jak by mělo, fungovalo to někdy? Nebo se jedná o součást nové implementace/nastavení? Přidali jste nedávno nějaké nové aplikace nebo hostitele?
  • Jak měříte výkon nebo jak je výkon ovlivněn? Dochází na straně hostitele k prodlevám či chybám? Hlásí koncoví uživatelé pomalý výkon?
  • Došlo v nedávné době k nějakým změnám v prostředí SAN (hostitelé, přepínače, pole)?
  • Dopad (dotčené aplikace, počet dotčených serverů, počet dotčených uživatelů atd.)
  • Jak často k problému dochází? (nepřetržitě/pravidelně/jednorázově/náhodně)
  • Jaké jsou názvy dotčených hostitelů?
  • Jaká topologie se používá? FC, iSCSI nebo Ethernet? (Pokud používají iSCSI, MUSÍ mít všichni hostitelé vypnutou funkci TCP Delayed ACK.
  • Pokud se problém může týkat konektivity, pravděpodobně bude podpora potřebovat schéma topologie.
  • Vyskytuje se v síti současně známý problém nebo byla síť nedávno upgradována? Zkontrolujte také, že se protokol iSCSI nepoužívá v interní síti LAN a že se používají pouze přepínače podnikové třídy.

 

PROBLÉMY SE SOUBORY

  • Uveďte jasný a podrobný popis problému:
  • Jaké konkrétní protokoly používáte?
    • Příklad: NFS (verze), CIFS (verze), NDMP, iSCSI, FTP atd.
  • Souvisí problém s konkrétním exportem / sdílenou složkou, systémem souborů / jednotkou LUN?
  • V jaké denní době k problému dochází? (Datum, čas a časové pásmo)
  • Jaké je v té době aktivní pracovní zatížení?
    • Příklad: přihlášení, odhlášení, zálohování, dávkové úlohy atd.
  • Kterých hostitelů se to týká?
    • Příklad: Zálohy, virtuální počítače, pracovní stanice, servery atd.? 
    • Konkrétní podrobnosti o aplikaci.
  • Jak vypadá konfigurace sítě?
    • Uveďte podrobnosti o konkrétním rozhraní / síťové kartě.
  • Jsou síťová rozhraní izolována na samostatných síťových kartách?
    • Příklad: Provoz replikace na vyhrazené síťové kartě


Shromažďování souborů servisních dat (kolekce dat)

Chcete-li získat soubor servisních dat (kolekci dat), přečtěte si článek LKB 000023676. K zobrazení podrobné konfigurace pole a všech událostí, které se vyskytly v poli, budou nezbytné výstupní soubory ze souboru servisních dat v poli. Podpora zákazníkům doporučuje shromáždit soubor servisních dat (kolekci dat) co nejdříve po výskytu události.

 

 

Nezapomeňte, že soubor servisních dat bude obsahovat pouze poslední kompletní soubor UPA (s pokrytím jedné hodiny) a jakýkoli dostupný -tmp.archive soubor UPA. Často tyto informace nestačí k řádné kontrole výkonu a budou vyžadovány další soubory UPA.

Chcete-li najít soubor UPA v souboru servisních dat (kolekci dat), přejděte do spx\cmd_outputs\metrics\

  • spx = Primární SP

  • Příklad: Pokud je SPA aktivním SP, UPA je pod spa\cmd_outputs\metrics

 
Shromažďování souborů UPA

  • Podpora může požádat o další soubory UPA.
  • Na rozdíl od souboru servisních dat (kolekce dat) se v poli ukládají soubory UPA s pokrytím až 48 hodin. 
  • Soubory UPA vypadají jako v následujícím příkladu. Každý název souboru obsahuje datum a čas prvního datového bodu v souboru. Interval je 10 sekund a pokrývá jednu hodinu minus 10 sekund. Datum a čas v názvech souborů jsou v časovém pásmu UTC/GMT.
    • Poslední soubor UPA v příkladu níže představuje nejaktuálnější archiv (-tmp.archive). Obsahuje aktuální data o výkonu a je možné je zkopírovat z pole (pouze prostřednictvím SSH/CLI), a zobrazit tak nejaktuálnější data. Podpora může tento soubor použít k zobrazení událostí výkonu, aniž by se muselo čekat na další hodinu.

Příklad souborů UPA uložených v poli Dell Unity:
01/05/2017  10:59 AM        11,017,216 _default_20170105_150000.archive
01/05/2017  11:59 AM        11,017,216 _default_20170105_160000.archive
01/05/2017  01:00 PM        11,017,216 _default_20170105_170000.archive
01/05/2017  01:59 PM        10,983,424 _default_20170105_180000.archive
01/05/2017  02:45 PM         8,308,736 _default_20170105_190000-tmp.archive

 

 
Ke shromáždění souborů UPA lze použít dvě metody (rozhraní příkazového řádku a Unisphere/GUI):

 

Prostřednictvím rozhraní Unisphere/GUI
1. možnost: Seznam Unisphere


Tato možnost je k dispozici pouze pro prostředí Unity OE verze 4.2 a vyšší. Nemusí zde být uvedeny všechny dostupné soubory UPA. Uživatelské rozhraní (Unisphere) je omezené a lze zobrazit jen některé dostupné soubory. Pokud požadovaný soubor UPA není uvedený, přejděte ke 2. možnosti nebo použijte SSH/CLI.


Seznam Unisphere

2. možnost: Časový rozsah Unisphere
  • Můžete vybrat časový rozsah, ze kterého má systém stáhnout dostupné soubory UPA.
    • Před shromážděním protokolů potvrďte čas výskytu problému, aby se stáhly pouze nezbytné protokoly.
  • Nezapomeňte, že časový rozsah zákazníka je uveden v místním čase prohlížeče, který je často stejný jako aktuální čas pracovní stanice.
  • Tato možnost je k dispozici pouze pro prostředí Unity OE 4.2 a vyššíČasový rozsah Unisphere

Použití rozhraní SSH/CLI

Pomocí příkazového řádku se dá také získat přístup k dalším souborů UPA, které jsou v poli Unity (ale nejsou uvedeny v uživatelském rozhraní Unisphere) podle 1. možnosti.

  • Přihlaste se pomocí servisního uživatele a servisního hesla

  • Zkopírujte požadované protokoly do /cores/service/user z /EMC/backend/metricsluna1/archives

  • Stáhněte si tyto protokoly prostřednictvím WinSCP nebo podobného nástroje

    • Pokud je pole v prostředí OE 4.5.X nebo novějším, změňte protokol souborů na SCP

    • Přihlaste se pomocí servisního uživatele a servisního hesla

 
ll /EMC/backend/metricsluna1/archives/
cp /EMC/backend/metricsluna1/archives/_default_20230221_180000.archive.gz /cores/service/user

Poznámka: Pokud shromažďujete pouze aktuální soubory UPA, doporučujeme použít koncovku |tail-10, jelikož na backendu jsou k dispozici desítky souborů UPA. Můžete je však zobrazit všechny.

Soubory UPA prostřednictvím rozhraní příkazového řádku


 
Kolekce dat hostitele
Pokud se problém týká určitých hostitelů, mohou být zapotřebí výstupní soubory Grab hostitele (nebo EMC Report).

  • Přejděte na adresu https://www.dell.com/support/home/ (web podpory společnosti Dell) a vyhledejte nástroj Grab Utility pro správný hostitelský operační systém (například: ESXi Host Grab)
  • Stáhněte si nástroj a soubor README.
  • Podle pokynů v souboru README spusťte nástroj pro vybraný operační systém hostitele.

 
Protokoly přepínačů
Pokud k problému s výkonem dochází pouze u určitých cest, mohou být vyžadovány protokoly přepínače. Pokyny (podle používaného modelu) naleznete v následujícím článku LKB:
 

Brocade/Connectrix

Cisco


Záznamy trasování sítě (výpis TCP)
Některé problémy s výkonem souborů mohou souviset se sítí. Za účelem úplného určení příčiny problému může podpora vyžadovat trasování sítě.

Dell Unity: Zachycení trasování sítě TCP/IP z pole (oprava uživatelem)

Additional Information

Podívejte se na toto video:


Affected Products

Dell EMC Unity 300F, Dell EMC Unity 350F, Dell EMC Unity 400, Dell EMC Unity 400F, Dell EMC Unity 450F, Dell EMC Unity 500, Dell EMC Unity 500F, Dell EMC Unity 550F, Dell EMC Unity 600, Dell EMC Unity 600F

Products

Dell EMC Unity, Dell Unity 450F DC, Dell Unity 300, Dell Unity 300 DC, Dell Unity 350F DC, Dell EMC Unity XT 380, Dell EMC Unity XT 380F, Dell Unity 400 DC, Dell EMC Unity XT 480, Dell EMC Unity XT 480F, Dell EMC Unity 650F, Dell EMC Unity XT 680 , Dell EMC Unity XT 680F, Dell EMC Unity XT 880, Dell EMC Unity XT 880F, Dell EMC Unity Family |Dell EMC Unity All Flash, Dell EMC Unity Hybrid ...
Article Properties
Article Number: 000022748
Article Type: How To
Last Modified: 03 Sept 2025
Version:  7
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.