OneFS: Inspekcja połączeń i protokołów SMB przestaje działać po wyłączeniu lub włączeniu usługi SMB
Summary: Połączenie bloku komunikatów serwera (SMB) i inspekcja protokołu mogą przestać działać po wyłączeniu lub włączeniu usługi SMB.
Symptoms
Inspekcja protokołu jest włączona w klastrze:
# isi audit settings global view |grep "Protocol Auditing"
Protocol Auditing Enabled: Yes <<<<<<<<<<<
Usługa SMB zostanie wyłączona i ponownie włączona za pomocą polecenia:
# isi services -a smb disable The service 'smb' has been disabled. # isi services -a smb enable The service 'smb' has been enabled.
Węzły pokazują wysokie liczby zamkniętych połączeń na porcie TCP 445:
Na przykład:
# echo ">>> Any buildup of closed sockets against SMB? <<<"; isi_for_array -X 'netstat -an | grep "\.445" | grep CLOSED | wc -l' PowerScale-1: 7668 PowerScale-2: 7022 PowerScale-3: 7773 PowerScale-4: 7378
Po sprawdzeniu dziennika inspekcji nie ma żadnych nowych zdarzeń inspekcji SMB po wyłączeniu lub włączeniu usługi SMB:
Na przykład:
#isi_audit_viewer -t protocol -s "2025-01-15 11:30:00" | tail (SMB services is disabled/enabled around 11:30)
...
...
[88: Wed Jan 15 11:32:29 2025] {"id":"6bb81e75-a932-11ef-8b5b-0050569b863c","timestamp":1732321949246224,"payloadType":"bbce6a72-a92d-4330-a1f3-e9fd5aed8152","payload":"Shutting down audit driver: flt_audit"}
[89: Wed Jan 15 11:32:29 2025] {"id":"6bb8a404-a932-11ef-8b5b-0050569b863c","timestamp":1732321949249642,"payloadType":"7afb8d54-0aa7-4ed4-9691-341313ee37e3","payload":"Audit Driver: flt_audit Loaded"}
done
Brak gniazda do inspekcji usługi wejścia lwio proces:
# procstat -f $(pgrep lwio)|grep -i "audit_service.sock" #
Cause
Jest to problem z produktem w OneFS 9.7.1.x i OneFS 9.8.
Po wyłączeniu lub włączeniu usługi SMB gniazdo do inspekcji usługi nie jest prawidłowo przywracane w lwio . Powoduje to, że zdarzenia inspekcji SMB nie są wypychane do usługi inspekcji. W końcu kolejka inspekcji wewnątrz lwio jest pełny. lwio blokuje oczekiwanie na inspekcję operacji SMB.
Resolution
Problem z kodem został rozwiązany w OneFS 9.7.1.8, 9.10.1.0, 9.11 i nowszych.
Jeśli nie można uaktualnić klastra do poziomu kodu za pomocą poprawki. Postępuj zgodnie z procedurą obejścia problemu i uruchom ponownie lwio w węźle, którego dotyczy problem, aby przywrócić gniazdo do usługi inspekcji.
- Sprawdź, czy uruchomione są
lwioPID
# ps auxw|grep 'lw-container lwio' root 83816 0.0 1.4 123100 56184 - I< 7Jan25 0:06.95 lw-container lwio (lwio)
- Ponowne uruchomienie
lwio
# killall lwio #
- Potwierdź
lwioZmiany PID
# ps auxw|grep 'lw-container lwio' root 62370 0.0 0.9 84240 36200 - S< 04:14 0:00.19 lw-container lwio (lwio)
- Potwierdź, że usługa inspekcji gniazda wróciła
# procstat -f $(pgrep lwio)|grep -i audit 62370 lwio 21 s - rw------ 2 0 UDS 0 0 /var/run/audit_service.sock