Комутатор Connectrix серії B Паніка або розсинхронізація HA через нестачу ресурсів перемикача
Summary: Після відновлення після відмови високої доступності (HA) процесори керування (CP) не синхронізуються, і перезавантаження резервного CP не вирішує проблему.
Symptoms
Вплив:
- HA не перебуває в синхронізації після перемикання на відмову. Перезавантаження резервного CP не вирішує проблему.
- Процес фонової служби загального рівня доступу (CALD) перестає відповідати (програми керування використовують CALD)
- Виключіть ресурси
- Переключити паніку
Середовище:
- Апаратне забезпечення Dell: Connectrix ED-DCX7-4B
- Апаратне забезпечення Dell: Connectrix ED-DCX7-8B
- Апаратне забезпечення Dell: Connectrix ED-DCX6-4B
- Апаратне забезпечення Dell: Connectrix ED-DCX6-8B
- Апаратне забезпечення Dell: Коннектор ED-8510-8B
- Апаратне забезпечення Dell: Коннектор ED-8510-4B
- Апаратне забезпечення Dell: Коннектор DS-7730B
- Апаратне забезпечення Dell: Connectrix DS-7720B
- Апаратне забезпечення Dell: Коннектор DS-6630B
- Апаратне забезпечення Dell: Коннектор DS-6620B
- Апаратне забезпечення Dell: Connectrix DS-6610B
- Апаратне забезпечення Dell: Коннектор DS-6520B
- Апаратне забезпечення Dell: Коннектор DS-6510B
- Апаратне забезпечення Dell: Коннектор DS-6505B
- Апаратне забезпечення Dell: Connectrix MP-7810
- Програмне забезпечення Dell: Безпечний шлюз підключення
- Програмне забезпечення Dell: Безпечні віддалені сервіси
- Програмне забезпечення Dell: Технологія CloudIQ
- Програмне забезпечення Brocade: Fabric OS 8.x
- Програмне забезпечення Brocade: Fabric OS 9.x
Випуск:
- Фонова служба CALD завершує роботу або стає недоступною, і можлива паніка перемикання через потік критичних або високорівневих попереджень.
- HA не синхронізовано, якщо перемикач не може відновити фонову службу CALD.
- CloudIQ припиняє моніторинг комутатора
Помилки:
Дамп помилки: Симптомом є паніка Fabric OS CALD:
[KSWD-1002], 36479, SLOT 1 | FFDC | CHASSIS, WARNING, SWITCH_A, Detected termination of process cald:2395. [KSWD-1002], 36774, SLOT 1 | FFDC | CHASSIS, WARNING, SWITCH_A, Detected termination of process cald:3063. [KSWD-1002], 36855, SLOT 1 | FFDC | CHASSIS, WARNING, SWITCH_A, Detected termination of process cald:3868.
Приклади PDshow:
^EUnable to handle kernel paging request for unknown fault^M ^EFaulting instruction address: 0x401b4ad8^M ^EOops taken on: 2021-02-04 at 13:57:09:090194^M ^EOops: Kernel access of bad area, sig: 7 [#1]^M ^EPREEMPT ^ESMP NR_CPUS=4 ^ELTT NESTING LEVEL : 0 ^E^M SWD: SWD:swd_close_proc:Detected termination of cald:2150 (1) SWD: SWD:swd_close_proc:exit code:11, exit sig:17, parent sig:0 Service instances out of sync cald: unable to initialize ipc: -11 cal: ASP init failure (-4) /bin/cat: write error: No space left on device /bin/cat: write error: No space left on device
Вихід HADUMP:
== State == fcsw:0:0(2) IMG_INCOMP[A:S] IMG_COMP(1) fcsw0(M22) IMG_COMP IMG_COMP diagfss(M22) IMG_COMP IMG_COMP fc(M22) IMG_COMP IMG_COMP rt(M22) IMG_COMP IMG_COMP swc(M22) IMG_COMP IMG_COMP web(M22) IMG_COMP IMG_COMP md(M22) IMG_COMP IMG_COMP cal(M22) IMG_INCOMP IMG_COMP
ps exfcl, виведений у підтримку show:
CALD не вдалося перезапустити, оскільки початкова фонова служба перейшла в неіснуючий стан, і коли FOS спробував ініціалізувати нового демона CALD, він не зміг цього зробити, оскільки CALD мав стан, який вказував на те, що він все ще живий.
0 0 2150 1824 18 0 0 0 - Z ? 25919:54 \_ cald <defunct>
Конкретна умова:
безпечні віддалені служби та/або шлюз безпечного підключення, що контролює комутатор
Cause
Це було видно в FOS 8.2.3c1.
Вихід потоку з ресурсного стану в результаті витоку ресурсів із потоком Secure Remote Support у CALD, створеним для надсилання виводу шоу підтримки на сервер Secure Remote Services.
Причина невдалого перезапуску CALD пов'язана з окремим дефектом.
Першопричина:
CALD не вдалося перезапустити, оскільки початкова фонова служба перейшла в неіснуючий стан, і коли FOS спробував ініціалізувати нову фонову службу cald, вона не змогла цього зробити, оскільки CALD мав статус, який вказував на те, що він все ще живий. Це призвело до того, що FOS не зміг перевести новий фон CALD у робочий стан.
0 0 2150 1824 18 0 0 0 - Z ? 25919:54 \_ cald <defunct>
SWD: SWD:swd_close_proc:Detected termination of cald:2150 (1) SWD: SWD:swd_close_proc:exit code:11, exit sig:17, parent sig:0 Service instances out of sync cald: unable to initialize ipc: -11 cal: ASP init failure (-4) /bin/cat: write error: No space left on device /bin/cat: write error: No space left on device
Інженерні бекпорти вставляють обидва виправлення у 8.2.3e.
Resolution
Виправити:
Оновлення до:
- Fabric OS v8.2.3e або новішої версії
- Fabric OS v9.1.1d або новішої версії
- Fabric OS v9.2.0b або новішої версії
- Fabric OS v9.2.1 або новішої версії
Спосіб вирішення:
Перемикач повинен пройти через холодне завантаження, щоб відновитися і синхронізувати ЦП. На вимикачі віддайте наведену нижче команду та потягніть за кабель живлення.
sysshutdown
Уважно стежте за комутаторами на наявність критичних сповіщень і негайно усувайте умови, що викликають критичні сповіщення, або зніміть контроль за перемиканням із захищених віддалених служб або шлюзу безпечного підключення.
Additional Information
- Якщо запущено вторинний процес CALD, комутатор все одно має пройти процедуру відновлення спроби hafailover (бажано у вікні обслуговування), і якщо HA розсинхронізується, потрібне перезавантаження COLD.
Парча ДЕФЕКТ FOS-854095