OneFS: SMB-tilkobling og protokollrevisjon slutter å fungere etter at SMB-tjenesten er deaktivert eller aktivert
Summary: SMB-tilkobling (Server Message Block) og protokollrevisjon kan slutte å fungere etter at SMB-tjenesten er deaktivert eller aktivert.
Symptoms
Protokollovervåking er aktivert på klyngen:
# isi audit settings global view |grep "Protocol Auditing"
Protocol Auditing Enabled: Yes <<<<<<<<<<<
SMB-tjenesten er deaktivert og aktivert på nytt med kommandoen:
# isi services -a smb disable The service 'smb' has been disabled. # isi services -a smb enable The service 'smb' has been enabled.
Noder viser høye lukkede tilkoblinger på TCP-port 445:
For eksempel:
# echo ">>> Any buildup of closed sockets against SMB? <<<"; isi_for_array -X 'netstat -an | grep "\.445" | grep CLOSED | wc -l' PowerScale-1: 7668 PowerScale-2: 7022 PowerScale-3: 7773 PowerScale-4: 7378
Kontrollerte overvåkingsloggen, og den viser at ingen nye SMB-revisjonshendelser etter at SMB-tjenesten er deaktivert eller aktivert:Eksempel:
#isi_audit_viewer -t protocol -s "2025-01-15 11:30:00" | tail (SMB services is disabled/enabled around 11:30)
...
...
[88: Wed Jan 15 11:32:29 2025] {"id":"6bb81e75-a932-11ef-8b5b-0050569b863c","timestamp":1732321949246224,"payloadType":"bbce6a72-a92d-4330-a1f3-e9fd5aed8152","payload":"Shutting down audit driver: flt_audit"}
[89: Wed Jan 15 11:32:29 2025] {"id":"6bb8a404-a932-11ef-8b5b-0050569b863c","timestamp":1732321949249642,"payloadType":"7afb8d54-0aa7-4ed4-9691-341313ee37e3","payload":"Audit Driver: flt_audit Loaded"}
done
Ingen sokkel å revisjonstjeneste i lwio prosess:
# procstat -f $(pgrep lwio)|grep -i "audit_service.sock" #
Cause
Dette er et produktproblem i OneFS 9.7.1.x og OneFS 9.8.
Etter at SMB-tjenesten er deaktivert eller aktivert, er kontakten for å revidere tjenesten ikke riktig gjenopprettet i lwio prosess. Det fører til at SMB-revisjonshendelsene ikke sendes til revisjonstjenesten. Til slutt revisjonskøen inne lwio er full. lwio står fast og venter til SMB-operasjonene kan overvåkes.
Resolution
Kodeproblemet er løst i OneFS 9.7.1.8, 9.10.1.0, 9.11 og nyere OneFS.
Hvis klyngen ikke kan oppgraderes til kodenivå med reparasjonen. Følg den midlertidige løsningen, start på nytt lwio på den berørte noden for å gjenopprette socket to audit-tjenesten.
- Bekreft at virksomheten kjører
lwioPID
# ps auxw|grep 'lw-container lwio' root 83816 0.0 1.4 123100 56184 - I< 7Jan25 0:06.95 lw-container lwio (lwio)
- Omstart
lwio
# killall lwio #
- Bekreft
lwioPID-endringer
# ps auxw|grep 'lw-container lwio' root 62370 0.0 0.9 84240 36200 - S< 04:14 0:00.19 lw-container lwio (lwio)
- Bekreft at socket to audit-tjenesten er tilbake
# procstat -f $(pgrep lwio)|grep -i audit 62370 lwio 21 s - rw------ 2 0 UDS 0 0 /var/run/audit_service.sock