Dell Unity: Sådan indsamles de nødvendige oplysninger til en Unity-præstationsanalyse
Summary: Denne artikel viser, hvordan du indsamler logfiler og data til diagnosticering af problemer med ydeevnen på Unity-systemer.
Instructions
Problem
-
Dårlig læse- eller skriveydelse (eller begge dele) eller høje svartider for tilsluttede værter.
-
Responstiden for værtsprogrammer er blevet forøget eller er uacceptabelt lang.
-
Problemer med ydeevnen på et Dell Unity-system, som kræver analyse af ydeevnen.
Problemer med ydeevnen kan have flere årsager. Disse omfatter: netværkskonfiguration, overbelastning, værtskonfiguration, hardwarefejl, diskstrid (flere travle LUN'er deler de samme drev) eller lagersystemet, der er maksimalt udnyttet.
Unity Technical Support kan ikke undersøge og foretage fejlfinding af ydelsesproblemer fuldt ud, før følgende er leveret:
- Servicedatafil (dataindsamling)
- UPA-filer (Unity Performance Archives)
- En detaljeret beskrivelse af de symptomer, der opleves i produktionsmiljøet
Hvis du ikke straks angiver oplysningerne i denne artikel i Dells vidensbase (KB), kan det medføre længere løsningstider.
Detaljerne i præstationsproblemerne (symptomer, tidsstempler osv.) er afgørende, så ingeniøren ved, hvor han skal fokusere (tidspunkter, LUN'er, værter osv.), I stedet for at bruge flere timer på at finde problemet (ikke årsagen). Uden denne detalje kan der bruges timer på at søge efter et problem kun for at kunne analysere den generelle præstationsstatistik.
Omfanget
Kundesupport undersøger præstationssager for at identificere problemer, der påvirker kundewebsteder. Justering af ydeevne (for at opnå optimal ydeevne for en vært eller et program) og omkonfiguration er en opgave, der påhviler en storageadministrator eller en løsningsarkitekt – dette håndteres ikke i en serviceanmodning om afhjælpning ved nedbrud.
Serviceanmodninger, der ikke involverer et defineret problem, f.eks. anmodning om en rapport over det aktuelle arbejdsbelastningsniveau på et system, er uden for chartret for Break-Fix-support. Til selvhjælp eller dem, der har brug for hjælp til at bestemme arbejdsbelastningsniveauet på et system, kan bruge LiveOptics-tjenesten. Se følgende artikel for at få detaljerede oplysninger om denne indstilling:
Data- og informationskrav til en detaljeret præstationsanalyse
For hver hændelse har teknisk support brug for følgende logfiler og oplysninger, der dækker hændelsesperioden:
- Servicedatafiler (også kendt som Data Collects), der genereres kort efter, at problemet opstod.
- Hvis replikering er i brug, er der brug for Data Collects- og UPA-filer fra beggesystemer.
- Unity UPA-filer (Unity Performance Archives), som dækker hele perioden, hvor problemet opstod.
- Det kan også være nødvendigt at logge værtsgreb og switch, hvis problemet ser ud til at være uden for systemet.
- Unity Network Traces kan også være påkrævet.
PROBLEMER MED BLOKERINGER
- Giv en klar og detaljeret problembeskrivelse:
- Hvornår opstod problemet? (Dato, klokkeslæt og tidszone)
- Hvilke LUN'er er berørt?
- Dette er vigtigt for at indsnævre søgningen.
- Er datareduktion eller avanceret deduplikering aktiveret på de LUN'er, der oplever problemer? Er datareduktion aktiveret for andre LUN er? (Se hvidbogen om bedste fremgangsmåder i Unity – afsnittet CPU-udnyttelse – side 9)
- Er replikering i brug? Angiv oplysninger om RPO for replikering, og om problemet med ydeevnen forbedres, hvis replikering afbrydes midlertidigt.
- Er der eller var der på noget tidspunkt aktive data utilgængelige?
- Kører noget andet på det angivne tidspunkt? (Sikkerhedskopiering, job, batches, virusscanninger, optimering af værtsdisk (TRIM/UNMAP) osv.)
- Hvis noget ikke fungerer, som det skal, har det så nogensinde fungeret? Eller er dette en del af en ny implementering/opsætning? Er der tilføjet nye programmer eller værter for nylig?
- Hvordan måles ydeevne, eller hvad er virkningen? Forsinkelser eller fejl på værtssiden? Rapporterer slutbrugere langsommelighed?
- Er der nylige ændringer i SAN-miljøet (værter, switche, systemer)?
- Påvirkning (berørte applikationer, # af berørte servere, # af berørte brugere osv.)
- Hvor ofte opstår problemet? (konstant/regelmæssigt/engangs/tilfældigt)
- Hvad hedder de berørte værter?
- Hvilken topologi bruges? FC, iSCSI eller Ethernet? (Hvis du bruger iSCSI, SKAL alle værter have TCP Delayed ACK deaktiveret.
- Hvis problemet kan være omkring forbindelsen, kan Support anmode om et topologidiagram.
- Findes der samtidig et kendt problem i netværket, eller er netværket blevet opgraderet for nylig? Kontroller også, at iSCSI ikke bruges på det interne LAN, og at eventuelle switche, der anvendes, skal være switche i virksomhedsklassen.
FILPROBLEMER
- Giv en klar og detaljeret problembeskrivelse:
- Hvad er de specifikke protokoller involveret?
- Eksempel: NFS (version), CIFS (version), NDMP, iSCSI, FTP osv
- Er problemet relateret til en bestemt eksport/deling, filsystem/LUN?
- Hvilket tidspunkt på dagen opstår problemet? (Dato, klokkeslæt og tidszone)
- Hvad er den aktive arbejdsbyrde på det tidspunkt?
- Eksempel: login, logout, backup, batchjob osv
- Hvilke værter er involveret?
- Eksempel: Backup, VM'er, arbejdsstationer, servere osv.?
- Specifikke oplysninger om ansøgningen.
- Hvordan ser netværkskonfigurationen ud?
- Angiv oplysninger om specifik grænseflade/netværkskort.
- Er netværksgrænsefladerne isoleret på separate netværkskort?
- Eksempel: Replikeringstrafik på det dedikerede netværkskort
Indsamling af servicedatafil (dataindsamling)
For at indsamle servicedatafil (dataindsamling), se LKB 000023676. Outputfilerne fra den kørende tjenestedatafil på systemet er nødvendige for at vise den detaljerede systemkonfiguration og eventuelle hændelser, der opstod på systemet. Support anbefaler, at kunder indsamler servicedatafilen (dataindsamling) så hurtigt som muligt , efter hændelsen indtræffer.
Husk, at Service-datafilen indeholder den sidste komplette UPA-fil (en time) og alle tilgængelige -tmp.archive UPA-fil. Ofte er dette ikke nok information til en ordentlig præstationsgennemgang, og der kræves yderligere UPA'er.
Du kan finde UPA-filen i Servicedatafilen (Data Collect) ved at gå til spx\cmd_outputs\metrics\
-
spx= Primær SP -
Eksempel: Hvis SPA er den aktive SP, er UPA under
spa\cmd_outputs\metrics
Indsamling af UPA-filer
- Support beder muligvis om yderligere UPA-filer.
- I modsætning til Service Data File (Data Collect) gemmer systemet op til 48 timers UPA-filer.
- UPA-filerne ligner nedenstående eksempel. Hvert filnavn indeholder dato og klokkeslæt for det første datapunkt i filen. Intervallet er 10 sekunder og dækker en time minus 10 sekunder. Dato og klokkeslæt i filnavnene er UTC/GMT.
- Den sidste UPA-fil i eksemplet nedenfor er det nyeste arkiv (
-tmp.archive). Den indeholder de aktuelle ydelsesdata og kan kopieres fra systemet (kun ved hjælp af SSH/CLI) for at se på de nyeste data. Support kan bruge denne fil til at se ydeevnehændelser uden at vente til næste time.
- Den sidste UPA-fil i eksemplet nedenfor er det nyeste arkiv (
Eksempel på UPA-filer, der er gemt på Dell Unity-systemet:01/05/2017 10:59 AM 11,017,216 _default_20170105_150000.archive
01/05/2017 11:59 AM 11,017,216 _default_20170105_160000.archive
01/05/2017 01:00 PM 11,017,216 _default_20170105_170000.archive
01/05/2017 01:59 PM 10,983,424 _default_20170105_180000.archive
01/05/2017 02:45 PM 8,308,736 _default_20170105_190000-tmp.archive
Mulighed 1: Unisphere-liste
Denne indstilling er kun tilgængelig for Unity OE 4.2 og højere. Alle tilgængelige UPA'er vises muligvis ikke her. Der er en begrænsning for brugergrænsefladen (Unisphere), og kun nogle tilgængelige filer kan vises. Hvis den påkrævede UPA-fil ikke vises, skal du gå til mulighed 2 eller bruge SSH/CLI.
Valgmulighed 2: Unisphere-tidsinterval
- Du kan vælge et tidsinterval, hvor systemet skal trække tilgængelige UPA er.
- Bekræft problemtiden, før du indsamler logfiler, så kun de nødvendige logfiler downloades.
- Husk, at kundens tidsinterval er i den lokale browsertid og ofte er det samme som den aktuelle arbejdsstationstid.
- Denne indstilling er kun tilgængelig for Unity OE 4.2 og nyere

Brug af SSH/CLI
CLI kan også bruges til at få adgang til flere UPA'er, der findes på Unity-systemet (men som ikke er angivet i brugergrænsefladen (Unisphere) pr. mulighed 1.
-
Log på med tjenestebrugeren og tjenesteadgangskoden
-
Kopier de ønskede logfiler til
/cores/service/userfra/EMC/backend/metricsluna1/archives -
Download disse logfiler ved hjælp af WinSCP eller et lignende værktøj
-
Hvis systemet er på OE 4.5.X eller nyere, skal du ændre filprotokollen til SCP
-
Log på med tjenestebrugeren og tjenesteadgangskoden
-
ll /EMC/backend/metricsluna1/archives/
cp /EMC/backend/metricsluna1/archives/_default_20230221_180000.archive.gz /cores/service/user
Bemærk: Hvis du kun samler aktuelle UPA'er, kan du |hale-10, da der er snesevis af UPA-filer tilgængelige på backend; Du kan dog liste dem alle ud.

Host dataindsamling
Host Grab-outputfiler (eller EMC-rapport) kan være nødvendige, især hvis problemet er unikt for specifikke værter.
-
Gå til https://www.dell.com/support/home/ (Dells supportwebsted), og søg efter hjælpeprogrammet til det korrekte værtsoperativsystem (eksempel: ESXi-værtsgreb)
-
Download hjælpeprogrammet og README-filen.
-
Følg README-filen for at køre hjælpeprogrammet til den valgte værts operativsystem.
Switchlogfiler
Hvis problemet med ydeevnen kun eksisterer på visse stier, kan det være nødvendigt at skifte logfiler. Se følgende LKB for instruktioner (baseret på den anvendte model):
Brocade/Connectrix
TCP-dump (Network Trace Captures)
Nogle problemer med filydeevne kan være relateret til netværksproblemer. For fuldt ud at bestemme årsagen til et problem kan support anmode om netværksspor.
Dell Unity: Sådan registreres en TCP/IP-netværkssporing fra systemet. (Kan rettes af brugeren)