Connectrix Brocade serii B: SCN-1001 — przepełnienie kolejki SCN dla procesu snmpd
Podsumowanie: Powiadomienie o zmianie stanu (SCN): SCN-1001 — przepełnienie kolejki SCN dla procesu komunikatów SNMPD powoduje zakończenie SNMPd
Objawy
Zapytania SNMP (Simple Network Management Protocol) dotyczące następujących elementów mogą przestać odpowiadać z powodu rywalizacji z innymi wątkami SNMPD:
- Rozruch
- Data lub godzina instalacji oprogramowania wewnętrznego
- Rozruchowa programowalna pamięć tylko do odczytu (PROM) daty lub godziny instalacji
Funkcja FOS kontynuuje ponawianie tych zapytań do momentu zarejestrowania alertów przepełnienia kolejki SCN-1001 z powodu stanu zakleszczenia prowadzącego do zakończenia SNMPD.
Protokół SNMP kończy działanie podczas kwerend swBootPromLastUpdated, swFlashLastUpdated lub swBootProminstallDate z powodu zablokowanego wywołania RPM, które jest widoczne w poniższych danych wyjściowych:
ps exfcl /fabos/cliexec/errdump -a: 2023/12/01-21:16:29, [SCN-1001], 86271, SLOT 1 | FFDC | CHASSIS, CRITICAL, Dell_Brcd_X6-4, SCN queue overflow for process snmpd. 2023/12/01-21:16:29, [RAS-1001], 86272, SLOT 1 | CHASSIS, INFO, Dell_Brcd_X6-4, First failure data capture (FFDC) event occurred. 2023/12/01-21:16:29, [SCN-1001], 86273, SLOT 1 | FFDC | CHASSIS, CRITICAL, Dell_Brcd_X6-4, SCN queue overflow for process snmpd. 2023/12/01-21:16:37, [LOG-1000], 86280, SLOT 1 | CHASSIS, INFO, Dell_Brcd_X6-4, Previous message repeated 7 time(s). 2023/12/01-21:16:37, [SCN-1001], 86281, SLOT 1 | FFDC | CHASSIS, CRITICAL, Dell_Brcd_X6-4, SCN queue overflow for process snmpd. 2023/12/01-21:16:38, [LOG-1000], 86282, SLOT 1 | CHASSIS, INFO, Dell_Brcd_X6-4, Previous message repeated 1 time(s). 2023/12/01-21:16:38, [KSWD-1002], 6908, FFDC | CHASSIS, WARNING, Dell_Brcd_X6-4, Detected termination of process snmpd:2648.
/fabos/cliexec/hadump: --------------------------------------- TIME_STAMP: Dec 1 22:43:03.131548 --------------------------------------- Local CP (Slot 2, CP1): Active, Warm Recovered Remote CP (Slot 1, CP0): Standby, Healthy HA enabled, Heartbeat Up, HA State not in sync
Dane wyjściowe następującego polecenia wskazują zablokowany wątek RPM:
ps excfl /bin/ps exfcl: 0 0 29270 2413 20 0 0 0 exit Z ? 0:00 \_ snmpd <defunct> 0 0 23760 1 20 0 5144 3304 - R ? 5531:10 rpm. <<<<stuck RPM thread called by snmpd
Przyczyna
Ten problem został zidentyfikowany z powodu usterki FOS FOS-851141 w wersji FOS 9.1.1c.
Wartość swBootDate jest pobierana za pomocą interfejsu "Application Programming Interface (API)", który korzysta z operacji na plikach. Podobnie wartości swFlashLastUpdated i swBootProminstallDate są pobierane za pomocą innego interfejsu API, który używa zapytań RPM. Te operacje we/wy zazwyczaj zajmują trochę czasu. Próba wykonania kwerendy jest ponawiana podczas przetwarzania żądania SNMP GET dla tych parametrów w czasie, gdy agent SNMP przetwarza wiele żądań jednocześnie. Te ponawianie prób dodaje obciążenie dla agenta, co tworzy warunek przepełnienia kolejki, który prowadzi do zakończenia snmpd.
Rozwiązanie
Obejście problemu: Unikaj wysyłania zapytań SNMP.
Rozwiązanie: Oprogramowanie wewnętrzne zostało zoptymalizowane w kodzie SNMP v9.1.1c pod kątem buforowania danych, takich jak data lub godzina rozruchu oraz data lub godzina instalacji oprogramowania wewnętrznego. W wersji 9.1.1d zaewidencjonowano dodatkowe ulepszenie, które buforuje również program rozruchu z datą lub godziną instalacji podczas aktywacji SNMP. Dane buforowane są używane w tych zapytaniach, aby zapobiec rywalizacji między wątkami w ramach SNMPd.
Brocade WADA FOS-851141