Panik i Connectrix B-serieswitchen eller HA osynkroniserad på grund av att switchen får slut på resurser
Summary: Efter failover-funktionen med hög tillgänglighet (HA) synkroniseras inte kontrollprocessorerna (CP) och problemet löses inte genom att starta om standby-kontrollprocessorn.
Symptoms
Påverkan:
- HA är inte i synkronisering efter redundans. Att starta om standby-kontrollprocessorn löser inte problemet.
- CALD-processen (Common Access Layer Daemon) slutar svara (hanterbarhetsprogram använder CALD)
- Byta ut resurser
- Switchpanik
Miljö:
- Dells maskinvara: Connectrix ED-DCX7-4B
- Dells maskinvara: Connectrix ED-DCX7-8B
- Dells maskinvara: Connectrix ED-DCX6-4B
- Dells maskinvara: Connectrix ED-DCX6-8B
- Dells maskinvara: Connectrix ED-8510-8B
- Dells maskinvara: Connectrix ED-8510-4B
- Dells maskinvara: Connectrix DS-7730B
- Dells maskinvara: Connectrix DS-7720B
- Dells maskinvara: Connectrix DS-6630B
- Dells maskinvara: Connectrix DS-6620B
- Dells maskinvara: Connectrix DS-6610B
- Dells maskinvara: Connectrix DS-6520B
- Dells maskinvara: Connectrix DS-6510B
- Dells maskinvara: Connectrix DS-6505B
- Dells maskinvara: Connectrix MP-7810
- Dell-programvara: Säker anslutningsgateway
- Dell-programvara: Secure Remote Services
- Dell-programvara: CloudIQ
- Brocade-programvara: Fabric OS 8.x
- Brocade-programvara: Fabric OS 9.x
Problem:
- CALD-daemonen avslutas eller är inte tillgänglig och det kan uppstå panik i switchen på grund av en mängd kritiska varningar eller varningar på hög nivå.
- HA är inte synkroniserat om switchen inte kan återställa CALD-demonen.
- CloudIQ slutar övervaka switchen
Fel:
Err dump: Symptomet är CALD panic för Fabric OS:
[KSWD-1002], 36479, SLOT 1 | FFDC | CHASSIS, WARNING, SWITCH_A, Detected termination of process cald:2395. [KSWD-1002], 36774, SLOT 1 | FFDC | CHASSIS, WARNING, SWITCH_A, Detected termination of process cald:3063. [KSWD-1002], 36855, SLOT 1 | FFDC | CHASSIS, WARNING, SWITCH_A, Detected termination of process cald:3868.
Exempel på PDshow:
^EUnable to handle kernel paging request for unknown fault^M ^EFaulting instruction address: 0x401b4ad8^M ^EOops taken on: 2021-02-04 at 13:57:09:090194^M ^EOops: Kernel access of bad area, sig: 7 [#1]^M ^EPREEMPT ^ESMP NR_CPUS=4 ^ELTT NESTING LEVEL : 0 ^E^M SWD: SWD:swd_close_proc:Detected termination of cald:2150 (1) SWD: SWD:swd_close_proc:exit code:11, exit sig:17, parent sig:0 Service instances out of sync cald: unable to initialize ipc: -11 cal: ASP init failure (-4) /bin/cat: write error: No space left on device /bin/cat: write error: No space left on device
HADUMP-utdata:
== State == fcsw:0:0(2) IMG_INCOMP[A:S] IMG_COMP(1) fcsw0(M22) IMG_COMP IMG_COMP diagfss(M22) IMG_COMP IMG_COMP fc(M22) IMG_COMP IMG_COMP rt(M22) IMG_COMP IMG_COMP swc(M22) IMG_COMP IMG_COMP web(M22) IMG_COMP IMG_COMP md(M22) IMG_COMP IMG_COMP cal(M22) IMG_INCOMP IMG_COMP
ps exfcl-utdata i supportshowen:
CALD kunde inte starta om eftersom den ursprungliga demonen gick in i ett nedlagt tillstånd, och när FOS försökte initiera en ny CALD-demon kunde den inte göra det eftersom CALD hade en status som indikerade att den fortfarande levde.
0 0 2150 1824 18 0 0 0 - Z ? 25919:54 \_ cald <defunct>
Specifikt villkor:
Säkra fjärrtjänster och/eller säker anslutningsgateway övervaka switchen
Cause
Detta sågs i FOS 8.2.3c1.
Tråd ut ur resurstillståndet som ett resultat av en resursläcka med tråden Secure Remote Support i CALD, skapad för att skicka supportshowutdata till Secure Remote Services-servern.
Orsaken till att det inte går att starta om CALD beror på en separat defekt.
Orsaken:
CALD kunde inte starta om eftersom den ursprungliga demonen försattes i ett nedlagt tillstånd, och när FOS försökte initiera en ny cald-demon gick det inte eftersom CALD hade en status som indikerade att den fortfarande levde. Detta resulterade i att FOS inte kunde sätta den nya CALD-demonen i ett fungerande tillstånd.
0 0 2150 1824 18 0 0 0 - Z ? 25919:54 \_ cald <defunct>
SWD: SWD:swd_close_proc:Detected termination of cald:2150 (1) SWD: SWD:swd_close_proc:exit code:11, exit sig:17, parent sig:0 Service instances out of sync cald: unable to initialize ipc: -11 cal: ASP init failure (-4) /bin/cat: write error: No space left on device /bin/cat: write error: No space left on device
Teknikerna bakåtporterar båda rättningarna till 8.2.3e.
Resolution
Fixa:
Uppgradera till:
- Fabric OS v8.2.3e eller senare
- Fabric OS v9.1.1d eller senare
- Fabric OS 9.2.0b eller senare
- Fabric OS 9.2.1 eller senare
Workaround:
Switchen måste genomgå en kallstart för att återställa och synkronisera CP:erna. På switchen utfärdar du kommandot nedan och drar i strömkabeln.
sysshutdown
Övervaka switchar noggrant för kritiska varningar och åtgärda de förhållanden som orsakar de kritiska varningarna snabbt, eller avövervaka switchen från Secure Remote Services eller Secure Connect Gateway.
Additional Information
- Om det körs en sekundär CALD-process måste switchen fortfarande gå igenom återställningsproceduren för att försöka utföra failover (helst i en underhållsperiod) och om HA blir osynkroniserad krävs kall omstart.
Brocade DEFEKT FOS-854095