Connectrix B-Series -kytkimen paniikki tai HA epäsynkronoitu kytkimen resurssien loppumisen vuoksi
Summary: High Availability (HA) -vikasietotilan jälkeen Control Processor (CP) -suorittimia ei synkronoida, eikä CP-valmiustilan uudelleenkäynnistys ratkaise ongelmaa.
Symptoms
Vaikutus:
- HA ei ole synkronoinnissa vikasietotilan jälkeen. Valmiustilan CP:n uudelleenkäynnistys ei ratkaise ongelmaa.
- CALD (Common Access Layer -demoni) -prosessi lakkaa vastaamasta (hallittavuussovellukset käyttävät CALD:tä)
- Vaihda pois resursseista
- Vaihda paniikkia
Ympäristö:
- Dell-laitteisto: Connectrix ED-DCX7-4B
- Dell-laitteisto: Connectrix ED-DCX7-8B
- Dell-laitteisto: Connectrix ED-DCX6-4B
- Dell-laitteisto: Connectrix ED-DCX6-8B
- Dell-laitteisto: Connectrix ED-8510-8B
- Dell-laitteisto: Connectrix ED-8510-4B
- Dell-laitteisto: Connectrix DS-7730B
- Dell-laitteisto: Connectrix DS-7720B
- Dell-laitteisto: Connectrix DS-6630B
- Dell-laitteisto: Connectrix DS-6620B
- Dell-laitteisto: Connectrix DS-6610B
- Dell-laitteisto: Connectrix DS-6520B
- Dell-laitteisto: Connectrix DS-6510B
- Dell-laitteisto: Connectrix DS-6505B
- Dell-laitteisto: Connectrix MP-7810
- Dellin ohjelmistot: Varmistetun yhteyden välityspalvelin
- Dellin ohjelmistot: Secure Remote Services
- Dellin ohjelmistot: CloudIQ
- Brocade-ohjelmistot: Fabric OS 8.x
- Brocade-ohjelmistot: Fabric OS 9.x
Ongelma:
- CALD-daemon sulkeutuu tai ei ole käytettävissä, ja kytkinpaniikki voi johtua kriittisten tai korkean tason hälytysten tulvasta.
- HA ei ole synkronoitu, jos kytkin ei pysty palauttamaan CALD-demonia.
- CloudIQ lakkaa valvomasta kytkintä
Virheitä:
Virheen kaatopaikka: Oire on Fabric OS CALD -paniikki:
[KSWD-1002], 36479, SLOT 1 | FFDC | CHASSIS, WARNING, SWITCH_A, Detected termination of process cald:2395. [KSWD-1002], 36774, SLOT 1 | FFDC | CHASSIS, WARNING, SWITCH_A, Detected termination of process cald:3063. [KSWD-1002], 36855, SLOT 1 | FFDC | CHASSIS, WARNING, SWITCH_A, Detected termination of process cald:3868.
Esimerkkejä PDshow'sta:
^EUnable to handle kernel paging request for unknown fault^M ^EFaulting instruction address: 0x401b4ad8^M ^EOops taken on: 2021-02-04 at 13:57:09:090194^M ^EOops: Kernel access of bad area, sig: 7 [#1]^M ^EPREEMPT ^ESMP NR_CPUS=4 ^ELTT NESTING LEVEL : 0 ^E^M SWD: SWD:swd_close_proc:Detected termination of cald:2150 (1) SWD: SWD:swd_close_proc:exit code:11, exit sig:17, parent sig:0 Service instances out of sync cald: unable to initialize ipc: -11 cal: ASP init failure (-4) /bin/cat: write error: No space left on device /bin/cat: write error: No space left on device
HADUMP-lähtö:
== State == fcsw:0:0(2) IMG_INCOMP[A:S] IMG_COMP(1) fcsw0(M22) IMG_COMP IMG_COMP diagfss(M22) IMG_COMP IMG_COMP fc(M22) IMG_COMP IMG_COMP rt(M22) IMG_COMP IMG_COMP swc(M22) IMG_COMP IMG_COMP web(M22) IMG_COMP IMG_COMP md(M22) IMG_COMP IMG_COMP cal(M22) IMG_INCOMP IMG_COMP
ps exfcl -tuloste tukiohjelmassa:
CALD ei käynnistynyt uudelleen, koska alkuperäinen daemon lakkautettiin, ja kun FOS yritti alustaa uuden CALD-demonin, se ei onnistunut, koska CALD:n tila osoitti, että se oli vielä elossa.
0 0 2150 1824 18 0 0 0 - Z ? 25919:54 \_ cald <defunct>
Erityisehto:
Secure Remote Services ja/tai Secure Connect Gateway, joka valvoo kytkintä
Cause
Tämä nähtiin versiossa FOS 8.2.3c1.
Resurssin tilasta poistuminen resurssivuodon seurauksena CALD:n Secure Remote Support -säikeen kanssa, joka aiheutti tukiohjelman tuloksen lähettämisen Secure Remote Services -palvelimeen.
Syy CALD: n uudelleenkäynnistyksen epäonnistumiseen johtuu erillisestä viasta.
Syy:
CALD ei käynnistynyt uudelleen, koska alkuperäinen daemon meni lakkautettuun tilaan, ja kun FOS yritti alustaa uuden cald-demonin, se ei onnistunut, koska CALD: n tila osoitti, että se oli edelleen elossa. Tämä johti siihen, että FOS ei pystynyt asettamaan uutta CALD-demonia toimivaan tilaan.
0 0 2150 1824 18 0 0 0 - Z ? 25919:54 \_ cald <defunct>
SWD: SWD:swd_close_proc:Detected termination of cald:2150 (1) SWD: SWD:swd_close_proc:exit code:11, exit sig:17, parent sig:0 Service instances out of sync cald: unable to initialize ipc: -11 cal: ASP init failure (-4) /bin/cat: write error: No space left on device /bin/cat: write error: No space left on device
Tekninen taustaportti Molemmat korjaukset versioon 8.2.3e.
Resolution
Korjata:
Päivitys:
- Fabric OS v8.2.3e tai uudempi
- Fabric OS 9.1.1d tai uudempi
- Fabric OS 9.2.0b tai uudempi
- Fabric OS 9.2.1 tai uudempi
Workaround:
Kytkimen on läpäistävä kylmäkäynnistys, jotta CP:t voidaan palauttaa ja synkronoida. Anna kytkimessä alla oleva komento ja vedä virtajohdosta.
sysshutdown
Seuraa tarkasti kytkimiä kriittisten hälytysten varalta ja korjaa kriittiset hälytykset aiheuttavat olosuhteet nopeasti tai poista varkaus siirtymisestä Secure Remote Servicesistä tai Secure Connect Gatewaysta.
Additional Information
- Jos toissijainen CALD-prosessi on käynnissä, kytkimen on silti suoritettava hafailover-palautusmenettely (mieluiten huoltoikkunassa), ja jos HA ei ole synkronoitu, COLD-uudelleenkäynnistys on tarpeen.
Brokadin VIKA FOS-854095