Panik i Connectrix B-serieswitchen eller HA osynkroniserad på grund av att switchen får slut på resurser

Summary: Efter failover-funktionen med hög tillgänglighet (HA) synkroniseras inte kontrollprocessorerna (CP) och problemet löses inte genom att starta om standby-kontrollprocessorn.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Påverkan:

  • HA är inte i synkronisering efter redundans. Att starta om standby-kontrollprocessorn löser inte problemet.
  • CALD-processen (Common Access Layer Daemon) slutar svara (hanterbarhetsprogram använder CALD)
  • Byta ut resurser
  • Switchpanik

Miljö:

  • Dells maskinvara: Connectrix ED-DCX7-4B
  • Dells maskinvara: Connectrix ED-DCX7-8B
  • Dells maskinvara: Connectrix ED-DCX6-4B
  • Dells maskinvara: Connectrix ED-DCX6-8B
  • Dells maskinvara: Connectrix ED-8510-8B
  • Dells maskinvara: Connectrix ED-8510-4B
  • Dells maskinvara: Connectrix DS-7730B
  • Dells maskinvara: Connectrix DS-7720B
  • Dells maskinvara: Connectrix DS-6630B
  • Dells maskinvara: Connectrix DS-6620B
  • Dells maskinvara: Connectrix DS-6610B
  • Dells maskinvara: Connectrix DS-6520B
  • Dells maskinvara: Connectrix DS-6510B
  • Dells maskinvara: Connectrix DS-6505B
  • Dells maskinvara: Connectrix MP-7810
  • Dell-programvara: Säker anslutningsgateway
  • Dell-programvara: Secure Remote Services
  • Dell-programvara: CloudIQ
  • Brocade-programvara: Fabric OS 8.x
  • Brocade-programvara: Fabric OS 9.x

Problem:

  • CALD-daemonen avslutas eller är inte tillgänglig och det kan uppstå panik i switchen på grund av en mängd kritiska varningar eller varningar på hög nivå.
  • HA är inte synkroniserat om switchen inte kan återställa CALD-demonen.
  • CloudIQ slutar övervaka switchen

Fel:
Err dump: Symptomet är CALD panic för Fabric OS:

[KSWD-1002], 36479, SLOT 1 | FFDC | CHASSIS, WARNING, SWITCH_A, Detected termination of process cald:2395.
[KSWD-1002], 36774, SLOT 1 | FFDC | CHASSIS, WARNING, SWITCH_A, Detected termination of process cald:3063.
[KSWD-1002], 36855, SLOT 1 | FFDC | CHASSIS, WARNING, SWITCH_A, Detected termination of process cald:3868.

Exempel på PDshow:

^EUnable to handle kernel paging request for unknown fault^M
^EFaulting instruction address: 0x401b4ad8^M
^EOops taken on: 2021-02-04 at 13:57:09:090194^M
^EOops: Kernel access of bad area, sig: 7 [#1]^M
^EPREEMPT ^ESMP NR_CPUS=4 ^ELTT NESTING LEVEL : 0 ^E^M


SWD: SWD:swd_close_proc:Detected termination of cald:2150 (1)
SWD: SWD:swd_close_proc:exit code:11, exit sig:17, parent sig:0
Service instances out of sync
cald: unable to initialize ipc: -11
cal: ASP init failure (-4)
/bin/cat: write error: No space left on device
/bin/cat: write error: No space left on device

HADUMP-utdata:

== State ==
   fcsw:0:0(2) IMG_INCOMP[A:S]    IMG_COMP(1)
     fcsw0(M22)    IMG_COMP    IMG_COMP    
   diagfss(M22)    IMG_COMP    IMG_COMP    
        fc(M22)    IMG_COMP    IMG_COMP    
        rt(M22)    IMG_COMP    IMG_COMP    
       swc(M22)    IMG_COMP    IMG_COMP    
       web(M22)    IMG_COMP    IMG_COMP    
        md(M22)    IMG_COMP    IMG_COMP    
       cal(M22)    IMG_INCOMP    IMG_COMP

ps exfcl-utdata i supportshowen:
CALD kunde inte starta om eftersom den ursprungliga demonen gick in i ett nedlagt tillstånd, och när FOS försökte initiera en ny CALD-demon kunde den inte göra det eftersom CALD hade en status som indikerade att den fortfarande levde.

0     0  2150  1824  18   0      0     0 -      Z    ?        25919:54  \_ cald <defunct>

Specifikt villkor:
Säkra fjärrtjänster och/eller säker anslutningsgateway övervaka switchen

Cause

Detta sågs i FOS 8.2.3c1.
Tråd ut ur resurstillståndet som ett resultat av en resursläcka med tråden Secure Remote Support i CALD, skapad för att skicka supportshowutdata till Secure Remote Services-servern.

Orsaken till att det inte går att starta om CALD beror på en separat defekt.

Orsaken:
CALD kunde inte starta om eftersom den ursprungliga demonen försattes i ett nedlagt tillstånd, och när FOS försökte initiera en ny cald-demon gick det inte eftersom CALD hade en status som indikerade att den fortfarande levde. Detta resulterade i att FOS inte kunde sätta den nya CALD-demonen i ett fungerande tillstånd.

0     0  2150  1824  18   0      0     0 -      Z    ?        25919:54  \_ cald <defunct>
SWD: SWD:swd_close_proc:Detected termination of cald:2150 (1)
SWD: SWD:swd_close_proc:exit code:11, exit sig:17, parent sig:0
Service instances out of sync
cald: unable to initialize ipc: -11
cal: ASP init failure (-4)
/bin/cat: write error: No space left on device
/bin/cat: write error: No space left on device

Teknikerna bakåtporterar båda rättningarna till 8.2.3e.

Resolution

Fixa:
Uppgradera till:

  • Fabric OS v8.2.3e eller senare
  • Fabric OS v9.1.1d eller senare
  • Fabric OS 9.2.0b eller senare
  • Fabric OS 9.2.1 eller senare

Workaround:
Switchen måste genomgå en kallstart för att återställa och synkronisera CP:erna. På switchen utfärdar du kommandot nedan och drar i strömkabeln.

sysshutdown

Övervaka switchar noggrant för kritiska varningar och åtgärda de förhållanden som orsakar de kritiska varningarna snabbt, eller avövervaka switchen från Secure Remote Services eller Secure Connect Gateway.

Additional Information

  • Om det körs en sekundär CALD-process måste switchen fortfarande gå igenom återställningsproceduren för att försöka utföra failover (helst i en underhållsperiod) och om HA blir osynkroniserad krävs kall omstart.
Brocade DEFEKT FOS-853249
Brocade DEFEKT FOS-854095

Affected Products

Connectrix B-Series, Secure Connect Gateway, CloudIQ, EMC Secure Remote Services
Article Properties
Article Number: 000220385
Article Type: Solution
Last Modified: 05 Apr 2024
Version:  7
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.