Avamar: Avamar-palvelimen määrittäminen tunnettuun hallittuun tilaan

Summary: Tässä artikkelissa kerrotaan, miten Avamar-palvelin määritetään tunnettuun hallittuun tilaan.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Avamar-palvelimessa on monia automatisoituja tehtäviä, jotka voivat vaikuttaa vianmääritykseen ja ongelmanratkaisuun.

Tässä menettelyssä dokumentoidaan, miten Avamar asetetaan "tunnettuun hallittuun tilaan" odottamattoman tai ei-toivotun toiminnan estämiseksi.

Seuraavia tarkistuslistoja on noudatettava, kun suoritat manuaalisia ja edistyneitä huoltotöitä. Esimerkki:
  • Raitojen uudelleenrakentaminen
  • Solmujen uudelleenrakentaminen
  • Offline-solmujen käynnistäminen uudelleen
Tämä on tarkistuslista eikä opas toimintojen suorittamiseen tai tulosten tulkitsemiseen.

Tämä EI ole terveystarkastusratkaisu. Siinä oletetaan, että Avamar-palvelin on epäkunnossa.

Cause

Manuaaliset tai edistyneet ylläpitotoimet on suoritettava Avamar-palvelimessa.

Resolution

Huomio: Väärin käytettynä jotkin alla mainituista komennoista voivat aiheuttaa tietojen eheysongelmia tai tietojen menetyksen. Jos et ymmärrä komentoa tai sen suorittamisen seurauksia, pyydä apua Dell-tuelta tai paikalliselta Dell-kumppanin edustajalta.

Edellytykset:
  • Kaikki komennot on suoritettava järjestelmänvalvojana siten, että SSH-avaimet on ladattu artikkelikohtaisesti Avamar: Kirjautuminen Avamar-palvelimeen ja avainten lataaminen.
  • Jotkin komennot eivät välttämättä anna palautetta tai tulevat voimaan välittömästi. Komentoa ei pitäisi olla tarpeen suorittaa useammin kuin kerran.
  • Kaikille avmaint config --ava Komennot, varmista aina, että muutos on tullut voimaan. Suorita komento:
avmaint config --ava | grep <setting>
  • Manuaalista huoltoa tulee välttää. Anna huoltoaikataulun hallita huoltotehtäviä aina kun mahdollista.
Menetelmä:
  1. Seuraaviin kysymyksiin on vastattava näillä komennoilla, jotta ymmärrät Avamar-palvelimen yleisen tilan ennen minkään järjestelmän käsittelyä:
  • Kuinka vanha on viimeksi vahvistettu tarkistuspiste?
cplist
  • Ovatko kaikki raidat verkossa? Ovatko kaikki solmut verkossa?
status.dpn
  • Ovatko kaikki palvelut toiminnassa?
dpnctl status
  1. Tarkista käynnissä olevat huollot ja peruuta ne tarvittaessa:
    1. Keskeytä huoltotoimet huoltoajoituksen avulla, jotta ne eivät käynnisty uudelleen pysäyttämisen jälkeen.
avmaint sched suspend cp --ava
avmaint sched suspend hfscheck --ava
Älä keskeytä roskien keräystä (GC), koska se voi johtaa tarpeettomaan palautukseen.
  1. Suorita alla oleva komento ja tarkista, onko ylläpitotoimia käynnissä.
status.dpn
  • Jos tarkistuspiste on käynnissä, anna sen valmistua.
  • Jos HFScheck on käynnissä, se voidaan pysäyttää, jos palvelin ei ole järjestelmänvalvojatilassa (waitcgsan-vaihe) tai jos HFScheck on melkein valmis:
avmaint hfscheckstop --ava
  • Jos GC on käynnissä, se voidaan tappaa:
avmaint gckill --ava
Tämä saattaa kestää jonkin aikaa, koska nykyisen passin on oltava valmis.
  1. Kun ylläpitoa ei enää ole käynnissä, huoltoajoituksen on pysäytettävä:
dpnctl stop maint
  1. Pysäytä varmuuskopiointien ajoitustoiminto, lopeta varmuuskopioinnit tai palautukset ja keskeytä uudet yhteydet:
    1. Estä MCS:ää aloittamasta uusia varmuuskopioita:
dpnctl stop sched
  1. Luettele kaikki käynnissä olevat varmuuskopiot:
avmaint sessions --ava | grep sessionid
Jos jokin muu palautus kuin replikointi on käynnissä, selvitä käyttäjältä, voiko palautuksen valmistua.
  1. Kun käyttäjältä on saatu hyväksyntä, että varmuuskopiot voidaan tappaa puhtaasti (osittaiset varmuuskopiot luodaan) käyttöliittymän avulla tai epäsiististi käyttämällä:
avmaint kill -waittime=0 <sessionid>
  1. Näytä luettelo muista varmuuskopioista, joita edellinen komento ei ole lueteltu:
avmaint sessions --full
  1. Suoritettavan toiminnon mukaan varmuuskopiointityypin (avmaint getrefby) suorittaminen ei ehkä ole hyväksyttävää. Keskeytä siksi aikatauluttajat, jotta manuaaliset varmuuskopioinnit eivät ole sallittuja:
avmaint suspend
  1. Pysäytä replikointi (replikoinnin lähde tai kohde).
    1. Jos kyseessä on replikointilähde (palautus), käytä käyttöliittymää tai EM:ää tai lopeta replikointi lopettamalla prosessi.
    2. Tarkista replikoinnin kohteen (varmuuskopioinnin) kohdalla, onko replikointi käynnissä: 
avmaint sessions | grep path
  1. Etsi polusta /REPLICATE-toimialue . Lopeta replikointi lähderuudukossa vaiheen 4a menetelmillä.
  1. Poista rypistyminen käytöstä komennolla:
avmaint config --ava asynccrunching=false
Rutistuksen loppuminen voi kestää jopa 15 minuuttia. Tarkista GSAN-lokeista datasolmuista mahdolliset rutistusviestit.
  1. Poista tasapainotus käytöstä
    1. Tarkista, onko tasapainotus käynnissä:
avmaint config --ava | grep balancemin
Yleensä tasapainotusta ei pidä ottaa käyttöön (mikään muu arvo kuin 0), mutta on silti tärkeää tarkistaa.
  1. Tasapainotuksen poistaminen käytöstä:
avmaint config --ava balancemin=0
Tasapainotuksen pysähtyminen voi kestää jopa 15 minuuttia. Tarkista status.dpn-tiedostosta, siirtyykö raitoja varmistaaksesi, että tasapainotus on päättynyt.
  1. Tarkista kapasiteetti:
    1. Tarkista käyttöjärjestelmän kapasiteetti: 
avmaint nodelist --ava | grep fs-perc
  1. Tarkista tarkistuspisteiden koko:
mapall copy ~/cps                # only if cps does not exist on the data nodes
mapall --noerror './cps'
  1. Tarkista tarkistuspisteluettelosta, mitkä tarkistuspisteet ON säilytettävä (viimeinen vahvistettu tarkistuspiste kaikissa solmuissa):
cplist
Määritä yllä olevien tulosten perusteella, kuinka monta tarkistuspistettä voidaan säilyttää, mitkä ovat kriittisiä ja kuinka monta uutta tarkistuspistettä voidaan luoda.
Lisätietoja kapasiteetista on artikkelissa Avamar: Kapasiteetin hallinnan käsitteet ja koulutus
  1. Selvitä solmujen järjestys sekä loogisten ja fyysisten solmujen numeroiden erot:
nodenumbers
status.dpn
mapall --noerror 'tail -2 /data01/cur/gsan.log'
  1. Tarkista laitteisto
  • Kaikki automatisoidut tehtävät pitäisi nyt pysäyttää. 
  • Palvelimella pitäisi olla vain vähän toimintaa, ja manuaalisten tehtävien tai komentojen suorittamisen pitäisi olla turvallista. 
Tarkista palvelin tarkistamalla GSAN-lokit kaikista datasolmuista. Varmista, että tapahtumia kirjataan lokiin vain vähän tai ei lainkaan.
Käyttöaika-komennolla voi tarkistaa myös mapallin avulla, että datasolmujen kuormituskeskiarvo on alhainen (0,01–0,05)

Esimerkiksi:
mapall --noerror 'uptime' 

(0.0) ssh  -x  admin@10.xx.xx.xxx 'uptime'  
  16:39:29 up 100 days,  6:39,  0 users,  load average: 0.01, 0.02, 0.01 
(0.1) ssh  -x  admin@10.xx.xx.xxx 'uptime'  
  16:39:29 up 100 days,  6:39,  0 users,  load average: 0.02, 0.01, 0.01 
(0.2) ssh  -x  admin@10.xx.xx.xxx 'uptime'  
  16:39:29 up 100 days,  6:39,  0 users,  load average: 0.02, 0.01, 0.01
Yllä olevat vaiheet määrittävät palvelimen ei-tuotantotilaan. Palauta muutokset aina , kun kaikki manuaaliset tehtävät on tehty.

Additional Information

 

Affected Products

Avamar, Avamar Server
Article Properties
Article Number: 000170876
Article Type: Solution
Last Modified: 06 Aug 2025
Version:  15
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.