PowerScale: Den audit_flt-driver i SMB-processen er i nedlukningstilstand, hvilket forårsager node-DU
Summary: Der blev fundet et problem på OneFS 9.7-kode, hvor revisionsdriveren ikke indlæses korrekt i SMB-processen. Dette kan medføre manglende datatilgængelighed (DU).
Symptoms
Hvis klyngen er på udgivelseskoden 9.7.1.0 - 9.7.1.6, kan dette problem påvirke den. De vigtigste symptomer er:
- SMB-brugere kan ikke få adgang til nogle eller alle noder.
- SMB-tjenesten på nogle eller alle noder viser et stort antal forbindelser i lukket tilstand. Mens forbindelser i lukket tilstand kan forekomme på grund af forskellige årsager, er det også et symptom forbundet med dette specifikke problem. For at kontrollere dette skal du bruge følgende kommando:
isi_for_array -X 'netstat -an | grep "\.445 " | grep CLOSED | wc -l' | sort -V
Du skal forvente at se alle '0' i outputtet. Nedenfor er et eksempel på en klynge, der udviser dette problem:
MyCluster-1# isi_for_array -X 'netstat -an | grep "\.445 " | grep CLOSED | wc -l' | sort -V
MyCluster-1: 208
MyCluster-2: 425
MyCluster-3: 2228
MyCluster-4: 146
MyCluster-5: 5284
MyCluster-6: 964
- Overvågning er aktiveret på klyngen. Tjek med denne kommando:
isi audit settings global view | grep "Protocol Auditing"
MyCluster-1# isi audit settings global view | grep "Protocol Auditing"
Protocol Auditing Enabled: Yes
- Din klynge kører den berørte kode: 9.7.1.0 - 9.7.1.6
For endeligt at afgøre, om din klynge oplever dette problem, skal du indsende en serviceanmodning til Dell Support. De kan hjælpe med at undersøge SMB-kernedumpet fra LWIO-tjenesten.
Cause
Dette problem opstår, fordi SMB-processen ikke indlæser audit_flt Driver ved opstart. Dette problem udløses typisk, når SMB-tjenesten genstartes, f.eks. under en kodeopgradering eller failover og failback mellem klynger. Det kan dog ske, hvis SMB genstartes af en eller anden grund.
Resolution
Du kan afhjælpe problemet ved at genstarte SMB-tjenesten. Under normale omstændigheder bør en isoleret genstart af SMB være tilstrækkelig:
MyCluster-1# killall -6 lwio
Dette kan gøres på flere noder med isi_for_array. Nedenfor er et eksempel på genstart af SMB-tjenesten på noder 1-4:
MyCluster-1# isi_for_array -n1-4 'killall -6 lwio'
Hvis dette ikke løser problemet, kan det være nødvendigt at genstarte SMB og alle afhængigheder:
MyCluster-1# /usr/likewise/bin/lwsm restart lwio
Igen kan dette gøres på flere noder samtidigt ved hjælp af isi_for_array. Nedenfor er et eksempel på genstart af SMB-stakken på noder 1-4:
MyCluster-1# isi_for_array -n1-4 '/usr/likewise/bin/lwsm restart lwio'
Dette problem er løst i OneFS 9.7.1.7-koden og fremefter.