Dell Unity: Hvordan samle den nødvendige informasjonen for en Unity Performance Analysis
Summary: Denne artikkelen viser hvordan du samler inn logger og data for å diagnostisere ytelsesproblemer på Unity-arrayer.
Instructions
Problem
-
Dårlig lese- eller skriveytelse (eller begge) eller høye svartider for tilkoblede verter.
-
Svartider for vertsapplikasjoner har økt eller er uakseptabelt høye.
-
Ytelsesproblemer på en Dell Unity-array, som krever ytelsesanalyse.
Ytelsesproblemer kan ha flere årsaker. Disse inkluderer: nettverkskonfigurasjon, overbelastning, vertskonfigurasjon, maskinvarefeil, diskstrid (flere travle LUN-er som deler de samme stasjonene) eller at lagringsarrayen er ved maksimal utnyttelse.
Unity teknisk støtte kan ikke undersøke og feilsøke ytelsesproblemer fullstendig før følgende er angitt:
- Tjenestedatafil (datainnsamling)
- UPA-filer (Unity Performance Archives)
- En detaljert beskrivelse av symptomene som oppleves i produksjonsmiljøet
Hvis informasjonen i denne kunnskapsartikkelen fra Dell (KB) ikke oppgis umiddelbart, kan det føre til lengre løsningstider.
Detaljene i ytelsesproblemene (symptomer, tidsstempler og så videre) er avgjørende, slik at ingeniøren vet hvor han skal fokusere (tider, LUN-er, verter og så videre), i stedet for å bruke flere timer på å finne problemet (ikke årsaken). Uten denne detaljen kan timer brukes til å søke etter et problem bare for å kunne analysere den generelle ytelsesstatistikken.
Omfang
Kundestøttetjenester undersøker ytelsessaker for å identifisere problemer som påvirker kundens områder. Ytelsesjustering (for å oppnå maksimal ytelse for en vert eller et program) og ny konfigurasjon er en oppgave for en lagringsadministrator eller en løsningsarkitekt – dette håndteres ikke i en reparasjonsforespørsel.
Serviceforespørsler som ikke omfatter et definert problem, som å be om en rapport over gjeldende arbeidsmengde på et array, er utenfor charteret for reparasjonsstøtte. For selvhjelp eller de som trenger hjelp med å bestemme nivået på arbeidsbelastningen på et array, kan du bruke LiveOptics-tjenesten. Se følgende artikkel hvis du vil ha detaljert informasjon om dette alternativet:
Data- og informasjonskrav for en detaljert ytelsesanalyse
Teknisk støtte trenger følgende logger og informasjon som dekker hendelsesperioden for hver hendelse:
- Tjenestedatafiler (også kjent som datainnsamlinger), som ble generert kort tid etter at problemet oppstod.
- Hvis replikering er i bruk, kreves det datainnsamlinger og UPA-filer fra beggearrayene.
- Unity UPA-filer (Unity Performance Archives), som dekker hele perioden da problemet oppstod.
- Host Grabs og Switch logger kan også være nødvendig hvis problemet ser ut til å være utenfor arrayet.
- Unity Network Traces kan også være nødvendig.
PROBLEMER MED BLOKKERING
- Gi en klar og detaljert problembeskrivelse:
- Når skjedde problemet? (dato, klokkeslett og tidssone)
- Hvilke LUN-er er berørt?
- Dette er viktig for å begrense søket.
- Er datareduksjon eller avansert deduplisering aktivert på LUN-er som opplever problemer? Er datareduksjon aktivert for andre LUN-er? (Se Rapport om anbefalte fremgangsmåter for Unity – CPU-utnyttelse – side 9)
- Er replikering i bruk? Oppgi informasjon om RPO for replikering og om ytelsesproblemet forbedres hvis replikering settes på pause.
- Finnes det eller var det aktive data som ikke var tilgjengelig på noe tidspunkt?
- Kjører noe annet på det angitte tidspunktet? (Sikkerhetskopiering, jobber, grupper, virusskanninger, vertsdiskoptimalisering (TRIM/UNMAP) og så videre)
- Hvis noe ikke fungerer som det skal, har det noen gang fungert? Eller er dette en del av en ny implementering / oppsett? Ble det nylig lagt til noen nye applikasjoner eller verter?
- Hvordan måles ytelsen eller hva er effekten? Forsinkelser eller feil på vertssiden? Rapporterer sluttbrukere om treghet?
- Noen nylige endringer i SAN-miljøet (verter, svitsjer, array)?
- Påvirkning (berørte programmer, # til berørte servere, # til berørte brukere og så videre)
- Hvor ofte skjer problemet? (Konstant / regelmessig / engangs / tilfeldig)
- Hva heter de berørte vertene?
- Hvilken topologi brukes? FC, iSCSI eller Ethernet? (Hvis du bruker iSCSI, MÅ alle verter ha TCP-forsinket ACK deaktivert.
- Hvis problemet kan gjelde tilkobling, kan kundestøtte be om et topologidiagram.
- Finnes det et kjent problem i nettverket samtidig, eller har nettverket nylig blitt oppgradert? Kontroller også at iSCSI ikke brukes på det interne LAN, og at alle svitsjer som brukes, må være svitsjer i virksomhetsklassen.
FILPROBLEMER
- Gi en klar og detaljert problembeskrivelse:
- Hva er de spesifikke protokollene involvert?
- Eksempel: NFS (versjon), CIFS (versjon), NDMP, iSCSI, FTP og så videre
- Er problemet knyttet til en bestemt eksport/delt ressurs, filsystem/LUN?
- Når på døgnet oppstår problemet? (dato, klokkeslett og tidssone)
- Hva er den aktive arbeidsmengden på det tidspunktet?
- Eksempel: pålogging, utlogging, sikkerhetskopiering, satsvise jobber osv.
- Hvilke verter er involvert?
- Eksempel: Sikkerhetskopiering, VM-er, arbeidsstasjoner, servere osv.
- Spesifikke detaljer om applikasjonen.
- Hvordan ser nettverkskonfigurasjonen ut?
- Oppgi spesifikke grensesnitt/NIC-detaljer.
- Er nettverksgrensesnittene isolert på separate NIC-er?
- Eksempel: Replikeringstrafikk på det dedikerte nettverkskortet
Innsamling av tjenestedatafil (datainnsamling)
Hvis du vil samle inn tjenestedatafil (datainnsamling), kan du se LKB-000023676. Utdatafilene fra den kjørende tjenestedatafilen på arrayet er nødvendige for å vise den detaljerte arraykonfigurasjonen og eventuelle hendelser som oppstod på arrayet. Kundestøtte anbefaler at kundene samler inn tjenestedatafilen (datainnsamlingen) så snart som mulig etter at hendelsen har inntruffet.
Husk at tjenestedatafilen inneholder den siste fullstendige UPA-filen (én time) og eventuelle tilgjengelige -tmp.archive UPA-fil. Ofte er dette ikke nok informasjon for en skikkelig ytelsesvurdering, og det kreves ytterligere UPA-er.
Hvis du vil finne UPA-filen i tjenestedatafilen (datainnsamling), går du til spx\cmd_outputs\metrics\
-
spx= Primær SP -
Eksempel: Hvis SPA er den aktive SP-en, er UPA-en under
spa\cmd_outputs\metrics
Samle UPA-filer
- Støtte kan be om flere UPA-filer.
- I motsetning til tjenestedatafilen (datainnsamling) lagres arrayet med opptil 48 timer med UPA-filer.
- UPA-filene ser ut som eksemplet nedenfor. Hvert filnavn inneholder datoen og klokkeslettet for det første datapunktet i filen. Intervallet er 10 sekunder og dekker en time minus 10 sekunder. Dato og klokkeslett i filnavnene er UTC/GMT.
- Den siste UPA-filen i eksemplet nedenfor er det nyeste arkivet (
-tmp.archive). Denne inneholder gjeldende ytelsesdata og kan kopieres fra arrayet (bare ved hjelp av SSH/CLI) for å se på de nyeste dataene. Kundestøtte kan bruke denne filen til å se ytelseshendelser uten å vente til neste time.
- Den siste UPA-filen i eksemplet nedenfor er det nyeste arkivet (
Eksempel på UPA-filer som er lagret på Dell Unity-arrayet:01/05/2017 10:59 AM 11,017,216 _default_20170105_150000.archive
01/05/2017 11:59 AM 11,017,216 _default_20170105_160000.archive
01/05/2017 01:00 PM 11,017,216 _default_20170105_170000.archive
01/05/2017 01:59 PM 10,983,424 _default_20170105_180000.archive
01/05/2017 02:45 PM 8,308,736 _default_20170105_190000-tmp.archive
Alternativ 1: Unisphere Liste
Dette alternativet er bare tilgjengelig for Unity OE 4.2 og nyere. Alle tilgjengelige UPA-er er kanskje ikke oppført her. Det er en begrensning for brukergrensesnittet (Unisphere), og bare noen tilgjengelige filer kan vises. Hvis den nødvendige UPA-filen ikke er oppført, går du til alternativ 2 eller bruker SSH/CLI.
Alternativ 2: Unisphere Time Range
- Du kan velge et tidsintervall for systemet for å hente tilgjengelige UPA-er.
- Bekreft problemtiden før du samler inn logger, slik at bare de nødvendige loggene lastes ned.
- Husk at kundetidsområdet er i den lokale nettleseren og ofte det samme som gjeldende arbeidsstasjonstid.
- Dette alternativet er bare tilgjengelig for Unity OE 4.2 og nyere

Bruke SSH/CLI
CLI kan også brukes til å få tilgang til flere UPA-er som er i Unity-arrayet (men som ikke er oppført i brukergrensesnittet (Unisphere) per alternativ 1.
-
Logg inn med tjenestebrukeren og tjenestepassordet
-
Kopier de ønskede loggene til
/cores/service/userfra/EMC/backend/metricsluna1/archives -
Last ned disse loggene ved hjelp av WinSCP eller et lignende verktøy
-
Hvis arrayet er på OE 4.5.X eller nyere, endrer du filprotokollen til SCP
-
Logg inn med tjenestebrukeren og tjenestepassordet
-
ll /EMC/backend/metricsluna1/archives/
cp /EMC/backend/metricsluna1/archives/_default_20230221_180000.archive.gz /cores/service/user
Merk: Hvis du bare samler nåværende UPA-er, kan det være lurt |tail-10, siden det er dusinvis av UPA-filer tilgjengelig på backend; Du kan imidlertid liste dem alle ut.

Innsamling
av vertsdataHost Grab (eller EMC Report) utdatafiler kan være nødvendig, spesielt hvis problemet er unikt for bestemte verter.
-
Gå til https://www.dell.com/support/home/ (Dell Support-nettsted) og søk etter grab-verktøyet etter riktig vertsoperativsystem (eksempel: ESXi host grab)
-
Last ned verktøyet og README-filen.
-
Følg README-filen for å kjøre verktøyet for vertsoperativsystemet som er valgt.
Svitsj
loggerHvis ytelsesproblemet bare finnes på bestemte baner, kan det være nødvendig å bytte logger. Se følgende LKB for instruksjoner (basert på modellen som brukes):
Brocade/Connectrix
Registrering av nettverkssporing (TCP-dump)
Noen filytelsesproblemer kan være relatert til nettverksproblemer. For å kunne fastslå årsaken til et problem fullt ut, kan kundestøtte be om nettverkssporinger.
Dell Unity: Slik registrerer du en TCP/IP-nettverkssporing fra matrisen. (Kan rettes opp av bruker)