Комутатор Connectrix серії B Паніка або розсинхронізація HA через нестачу ресурсів перемикача

Summary: Після відновлення після відмови високої доступності (HA) процесори керування (CP) не синхронізуються, і перезавантаження резервного CP не вирішує проблему.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Вплив:

  • HA не перебуває в синхронізації після перемикання на відмову. Перезавантаження резервного CP не вирішує проблему.
  • Процес фонової служби загального рівня доступу (CALD) перестає відповідати (програми керування використовують CALD)
  • Виключіть ресурси
  • Переключити паніку

Середовище:

  • Апаратне забезпечення Dell: Connectrix ED-DCX7-4B
  • Апаратне забезпечення Dell: Connectrix ED-DCX7-8B
  • Апаратне забезпечення Dell: Connectrix ED-DCX6-4B
  • Апаратне забезпечення Dell: Connectrix ED-DCX6-8B
  • Апаратне забезпечення Dell: Коннектор ED-8510-8B
  • Апаратне забезпечення Dell: Коннектор ED-8510-4B
  • Апаратне забезпечення Dell: Коннектор DS-7730B
  • Апаратне забезпечення Dell: Connectrix DS-7720B
  • Апаратне забезпечення Dell: Коннектор DS-6630B
  • Апаратне забезпечення Dell: Коннектор DS-6620B
  • Апаратне забезпечення Dell: Connectrix DS-6610B
  • Апаратне забезпечення Dell: Коннектор DS-6520B
  • Апаратне забезпечення Dell: Коннектор DS-6510B
  • Апаратне забезпечення Dell: Коннектор DS-6505B
  • Апаратне забезпечення Dell: Connectrix MP-7810
  • Програмне забезпечення Dell: Безпечний шлюз підключення
  • Програмне забезпечення Dell: Безпечні віддалені сервіси
  • Програмне забезпечення Dell: Технологія CloudIQ
  • Програмне забезпечення Brocade: Fabric OS 8.x
  • Програмне забезпечення Brocade: Fabric OS 9.x

Випуск:

  • Фонова служба CALD завершує роботу або стає недоступною, і можлива паніка перемикання через потік критичних або високорівневих попереджень.
  • HA не синхронізовано, якщо перемикач не може відновити фонову службу CALD.
  • CloudIQ припиняє моніторинг комутатора

Помилки:
Дамп помилки: Симптомом є паніка Fabric OS CALD:

[KSWD-1002], 36479, SLOT 1 | FFDC | CHASSIS, WARNING, SWITCH_A, Detected termination of process cald:2395.
[KSWD-1002], 36774, SLOT 1 | FFDC | CHASSIS, WARNING, SWITCH_A, Detected termination of process cald:3063.
[KSWD-1002], 36855, SLOT 1 | FFDC | CHASSIS, WARNING, SWITCH_A, Detected termination of process cald:3868.

Приклади PDshow:

^EUnable to handle kernel paging request for unknown fault^M
^EFaulting instruction address: 0x401b4ad8^M
^EOops taken on: 2021-02-04 at 13:57:09:090194^M
^EOops: Kernel access of bad area, sig: 7 [#1]^M
^EPREEMPT ^ESMP NR_CPUS=4 ^ELTT NESTING LEVEL : 0 ^E^M


SWD: SWD:swd_close_proc:Detected termination of cald:2150 (1)
SWD: SWD:swd_close_proc:exit code:11, exit sig:17, parent sig:0
Service instances out of sync
cald: unable to initialize ipc: -11
cal: ASP init failure (-4)
/bin/cat: write error: No space left on device
/bin/cat: write error: No space left on device

Вихід HADUMP:

== State ==
   fcsw:0:0(2) IMG_INCOMP[A:S]    IMG_COMP(1)
     fcsw0(M22)    IMG_COMP    IMG_COMP    
   diagfss(M22)    IMG_COMP    IMG_COMP    
        fc(M22)    IMG_COMP    IMG_COMP    
        rt(M22)    IMG_COMP    IMG_COMP    
       swc(M22)    IMG_COMP    IMG_COMP    
       web(M22)    IMG_COMP    IMG_COMP    
        md(M22)    IMG_COMP    IMG_COMP    
       cal(M22)    IMG_INCOMP    IMG_COMP

ps exfcl, виведений у підтримку show:
CALD не вдалося перезапустити, оскільки початкова фонова служба перейшла в неіснуючий стан, і коли FOS спробував ініціалізувати нового демона CALD, він не зміг цього зробити, оскільки CALD мав стан, який вказував на те, що він все ще живий.

0     0  2150  1824  18   0      0     0 -      Z    ?        25919:54  \_ cald <defunct>

Конкретна умова:
безпечні віддалені служби та/або шлюз безпечного підключення, що контролює комутатор

Cause

Це було видно в FOS 8.2.3c1.
Вихід потоку з ресурсного стану в результаті витоку ресурсів із потоком Secure Remote Support у CALD, створеним для надсилання виводу шоу підтримки на сервер Secure Remote Services.

Причина невдалого перезапуску CALD пов'язана з окремим дефектом.

Першопричина:
CALD не вдалося перезапустити, оскільки початкова фонова служба перейшла в неіснуючий стан, і коли FOS спробував ініціалізувати нову фонову службу cald, вона не змогла цього зробити, оскільки CALD мав статус, який вказував на те, що він все ще живий. Це призвело до того, що FOS не зміг перевести новий фон CALD у робочий стан.

0     0  2150  1824  18   0      0     0 -      Z    ?        25919:54  \_ cald <defunct>
SWD: SWD:swd_close_proc:Detected termination of cald:2150 (1)
SWD: SWD:swd_close_proc:exit code:11, exit sig:17, parent sig:0
Service instances out of sync
cald: unable to initialize ipc: -11
cal: ASP init failure (-4)
/bin/cat: write error: No space left on device
/bin/cat: write error: No space left on device

Інженерні бекпорти вставляють обидва виправлення у 8.2.3e.

Resolution

Виправити:
Оновлення до:

  • Fabric OS v8.2.3e або новішої версії
  • Fabric OS v9.1.1d або новішої версії
  • Fabric OS v9.2.0b або новішої версії
  • Fabric OS v9.2.1 або новішої версії

Спосіб вирішення:
Перемикач повинен пройти через холодне завантаження, щоб відновитися і синхронізувати ЦП. На вимикачі віддайте наведену нижче команду та потягніть за кабель живлення.

sysshutdown

Уважно стежте за комутаторами на наявність критичних сповіщень і негайно усувайте умови, що викликають критичні сповіщення, або зніміть контроль за перемиканням із захищених віддалених служб або шлюзу безпечного підключення.

Additional Information

  • Якщо запущено вторинний процес CALD, комутатор все одно має пройти процедуру відновлення спроби hafailover (бажано у вікні обслуговування), і якщо HA розсинхронізується, потрібне перезавантаження COLD.
Парча ДЕФЕКТ FOS-853249
Парча ДЕФЕКТ FOS-854095

Affected Products

Connectrix B-Series, Secure Connect Gateway, CloudIQ, EMC Secure Remote Services
Article Properties
Article Number: 000220385
Article Type: Solution
Last Modified: 05 Apr 2024
Version:  7
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.