Avamar: Avamar-palvelimen määrittäminen tunnettuun hallittuun tilaan

요약: Tässä artikkelissa kerrotaan, miten Avamar-palvelin määritetään tunnettuun hallittuun tilaan.

이 문서는 다음에 적용됩니다. 이 문서는 다음에 적용되지 않습니다. 이 문서는 특정 제품과 관련이 없습니다. 모든 제품 버전이 이 문서에 나와 있는 것은 아닙니다.

증상

Avamar-palvelimessa on monia automatisoituja tehtäviä, jotka voivat vaikuttaa vianmääritykseen ja ongelmanratkaisuun.

Tässä menettelyssä dokumentoidaan, miten Avamar asetetaan "tunnettuun hallittuun tilaan" odottamattoman tai ei-toivotun toiminnan estämiseksi.

Seuraavia tarkistuslistoja on noudatettava, kun suoritat manuaalisia ja edistyneitä huoltotöitä. Esimerkki:
  • Raitojen uudelleenrakentaminen
  • Solmujen uudelleenrakentaminen
  • Offline-solmujen käynnistäminen uudelleen
Tämä on tarkistuslista eikä opas toimintojen suorittamiseen tai tulosten tulkitsemiseen.

Tämä EI ole terveystarkastusratkaisu. Siinä oletetaan, että Avamar-palvelin on epäkunnossa.

원인

Manuaaliset tai edistyneet ylläpitotoimet on suoritettava Avamar-palvelimessa.

해결

Huomio: Väärin käytettynä jotkin alla mainituista komennoista voivat aiheuttaa tietojen eheysongelmia tai tietojen menetyksen. Jos et ymmärrä komentoa tai sen suorittamisen seurauksia, pyydä apua Dell-tuelta tai paikalliselta Dell-kumppanin edustajalta.

Edellytykset:
  • Kaikki komennot on suoritettava järjestelmänvalvojana siten, että SSH-avaimet on ladattu artikkelikohtaisesti Avamar: Kirjautuminen Avamar-palvelimeen ja avainten lataaminen.
  • Jotkin komennot eivät välttämättä anna palautetta tai tulevat voimaan välittömästi. Komentoa ei pitäisi olla tarpeen suorittaa useammin kuin kerran.
  • Kaikille avmaint config --ava Komennot, varmista aina, että muutos on tullut voimaan. Suorita komento:
avmaint config --ava | grep <setting>
  • Manuaalista huoltoa tulee välttää. Anna huoltoaikataulun hallita huoltotehtäviä aina kun mahdollista.
Menetelmä:
  1. Seuraaviin kysymyksiin on vastattava näillä komennoilla, jotta ymmärrät Avamar-palvelimen yleisen tilan ennen minkään järjestelmän käsittelyä:
  • Kuinka vanha on viimeksi vahvistettu tarkistuspiste?
cplist
  • Ovatko kaikki raidat verkossa? Ovatko kaikki solmut verkossa?
status.dpn
  • Ovatko kaikki palvelut toiminnassa?
dpnctl status
  1. Tarkista käynnissä olevat huollot ja peruuta ne tarvittaessa:
    1. Keskeytä huoltotoimet huoltoajoituksen avulla, jotta ne eivät käynnisty uudelleen pysäyttämisen jälkeen.
avmaint sched suspend cp --ava
avmaint sched suspend hfscheck --ava
Älä keskeytä roskien keräystä (GC), koska se voi johtaa tarpeettomaan palautukseen.
  1. Suorita alla oleva komento ja tarkista, onko ylläpitotoimia käynnissä.
status.dpn
  • Jos tarkistuspiste on käynnissä, anna sen valmistua.
  • Jos HFScheck on käynnissä, se voidaan pysäyttää, jos palvelin ei ole järjestelmänvalvojatilassa (waitcgsan-vaihe) tai jos HFScheck on melkein valmis:
avmaint hfscheckstop --ava
  • Jos GC on käynnissä, se voidaan tappaa:
avmaint gckill --ava
Tämä saattaa kestää jonkin aikaa, koska nykyisen passin on oltava valmis.
  1. Kun ylläpitoa ei enää ole käynnissä, huoltoajoituksen on pysäytettävä:
dpnctl stop maint
  1. Pysäytä varmuuskopiointien ajoitustoiminto, lopeta varmuuskopioinnit tai palautukset ja keskeytä uudet yhteydet:
    1. Estä MCS:ää aloittamasta uusia varmuuskopioita:
dpnctl stop sched
  1. Luettele kaikki käynnissä olevat varmuuskopiot:
avmaint sessions --ava | grep sessionid
Jos jokin muu palautus kuin replikointi on käynnissä, selvitä käyttäjältä, voiko palautuksen valmistua.
  1. Kun käyttäjältä on saatu hyväksyntä, että varmuuskopiot voidaan tappaa puhtaasti (osittaiset varmuuskopiot luodaan) käyttöliittymän avulla tai epäsiististi käyttämällä:
avmaint kill -waittime=0 <sessionid>
  1. Näytä luettelo muista varmuuskopioista, joita edellinen komento ei ole lueteltu:
avmaint sessions --full
  1. Suoritettavan toiminnon mukaan varmuuskopiointityypin (avmaint getrefby) suorittaminen ei ehkä ole hyväksyttävää. Keskeytä siksi aikatauluttajat, jotta manuaaliset varmuuskopioinnit eivät ole sallittuja:
avmaint suspend
  1. Pysäytä replikointi (replikoinnin lähde tai kohde).
    1. Jos kyseessä on replikointilähde (palautus), käytä käyttöliittymää tai EM:ää tai lopeta replikointi lopettamalla prosessi.
    2. Tarkista replikoinnin kohteen (varmuuskopioinnin) kohdalla, onko replikointi käynnissä: 
avmaint sessions | grep path
  1. Etsi polusta /REPLICATE-toimialue . Lopeta replikointi lähderuudukossa vaiheen 4a menetelmillä.
  1. Poista rypistyminen käytöstä komennolla:
avmaint config --ava asynccrunching=false
Rutistuksen loppuminen voi kestää jopa 15 minuuttia. Tarkista GSAN-lokeista datasolmuista mahdolliset rutistusviestit.
  1. Poista tasapainotus käytöstä
    1. Tarkista, onko tasapainotus käynnissä:
avmaint config --ava | grep balancemin
Yleensä tasapainotusta ei pidä ottaa käyttöön (mikään muu arvo kuin 0), mutta on silti tärkeää tarkistaa.
  1. Tasapainotuksen poistaminen käytöstä:
avmaint config --ava balancemin=0
Tasapainotuksen pysähtyminen voi kestää jopa 15 minuuttia. Tarkista status.dpn-tiedostosta, siirtyykö raitoja varmistaaksesi, että tasapainotus on päättynyt.
  1. Tarkista kapasiteetti:
    1. Tarkista käyttöjärjestelmän kapasiteetti: 
avmaint nodelist --ava | grep fs-perc
  1. Tarkista tarkistuspisteiden koko:
mapall copy ~/cps                # only if cps does not exist on the data nodes
mapall --noerror './cps'
  1. Tarkista tarkistuspisteluettelosta, mitkä tarkistuspisteet ON säilytettävä (viimeinen vahvistettu tarkistuspiste kaikissa solmuissa):
cplist
Määritä yllä olevien tulosten perusteella, kuinka monta tarkistuspistettä voidaan säilyttää, mitkä ovat kriittisiä ja kuinka monta uutta tarkistuspistettä voidaan luoda.
Lisätietoja kapasiteetista on artikkelissa Avamar: Kapasiteetin hallinnan käsitteet ja koulutus
  1. Selvitä solmujen järjestys sekä loogisten ja fyysisten solmujen numeroiden erot:
nodenumbers
status.dpn
mapall --noerror 'tail -2 /data01/cur/gsan.log'
  1. Tarkista laitteisto
  • Kaikki automatisoidut tehtävät pitäisi nyt pysäyttää. 
  • Palvelimella pitäisi olla vain vähän toimintaa, ja manuaalisten tehtävien tai komentojen suorittamisen pitäisi olla turvallista. 
Tarkista palvelin tarkistamalla GSAN-lokit kaikista datasolmuista. Varmista, että tapahtumia kirjataan lokiin vain vähän tai ei lainkaan.
Käyttöaika-komennolla voi tarkistaa myös mapallin avulla, että datasolmujen kuormituskeskiarvo on alhainen (0,01–0,05)

Esimerkiksi:
mapall --noerror 'uptime' 

(0.0) ssh  -x  admin@10.xx.xx.xxx 'uptime'  
  16:39:29 up 100 days,  6:39,  0 users,  load average: 0.01, 0.02, 0.01 
(0.1) ssh  -x  admin@10.xx.xx.xxx 'uptime'  
  16:39:29 up 100 days,  6:39,  0 users,  load average: 0.02, 0.01, 0.01 
(0.2) ssh  -x  admin@10.xx.xx.xxx 'uptime'  
  16:39:29 up 100 days,  6:39,  0 users,  load average: 0.02, 0.01, 0.01
Yllä olevat vaiheet määrittävät palvelimen ei-tuotantotilaan. Palauta muutokset aina , kun kaikki manuaaliset tehtävät on tehty.

추가 정보

 

해당 제품

Avamar, Avamar Server
문서 속성
문서 번호: 000170876
문서 유형: Solution
마지막 수정 시간: 06 8월 2025
버전:  15
다른 Dell 사용자에게 질문에 대한 답변 찾기
지원 서비스
디바이스에 지원 서비스가 적용되는지 확인하십시오.