PowerScale: De audit_flt-driver in het SMB-proces heeft de status Afsluiten, waardoor knooppunt DU wordt veroorzaakt
Summary: Er is een probleem vastgesteld op OneFS 9.7-code, waarbij de auditdriver niet correct wordt geladen in het SMB-proces. Dit kan leiden tot niet-beschikbaarheid van gegevens (DU).
Symptoms
Als het cluster een releasecode 9.7.1.0 - 9.7.1.6 heeft, kan dit probleem van invloed zijn op het cluster. De belangrijkste symptomen zijn:
- MKB-gebruikers hebben geen toegang tot sommige of alle knooppunten.
- De SMB-service op sommige of alle knooppunten toont een groot aantal verbindingen in een gesloten status. Hoewel verbindingen in gesloten toestand om verschillende redenen kunnen optreden, is het ook een symptoom dat verband houdt met dit specifieke probleem. Om dit te controleren, gebruikt u de volgende opdracht:
isi_for_array -X 'netstat -an | grep "\.445 " | grep CLOSED | wc -l' | sort -V
Je zou verwachten dat je alle '0' in de uitvoer ziet. Hieronder ziet u een voorbeeld van een cluster met dit probleem:
MyCluster-1# isi_for_array -X 'netstat -an | grep "\.445 " | grep CLOSED | wc -l' | sort -V
MyCluster-1: 208
MyCluster-2: 425
MyCluster-3: 2228
MyCluster-4: 146
MyCluster-5: 5284
MyCluster-6: 964
- Controle is ingeschakeld op het cluster. Controleer met deze opdracht:
isi audit settings global view | grep "Protocol Auditing"
MyCluster-1# isi audit settings global view | grep "Protocol Auditing"
Protocol Auditing Enabled: Yes
- Uw cluster voert de betreffende code uit: 9.7.1.0 - 9.7.1.6
Om definitief te bepalen of uw cluster dit probleem ondervindt, dient u een serviceaanvraag in bij Dell Support. Zij kunnen helpen bij het onderzoeken van de SMB-coredump van de LWIO-service.
Cause
Dit probleem doet zich voor omdat het SMB-proces de audit_flt driver bij het opstarten. Dit probleem treedt meestal op wanneer de SMB-service opnieuw wordt gestart, zoals tijdens een code-upgrade of failover en failback tussen clusters. Het kan echter gebeuren als de SMB om welke reden dan ook opnieuw wordt opgestart.
Resolution
U kunt het probleem verhelpen door de SMB-service opnieuw op te starten. Onder normale omstandigheden zou een geïsoleerde herstart van de SMB voldoende moeten zijn:
MyCluster-1# killall -6 lwio
Dit kan worden gedaan op meerdere knooppunten met isi_for_array. Hieronder ziet u een voorbeeld van het opnieuw starten van de SMB-service op knooppunt 1-4:
MyCluster-1# isi_for_array -n1-4 'killall -6 lwio'
Als dit het probleem niet verhelpt, kan het nodig zijn om SMB en alle afhankelijkheden opnieuw te starten:
MyCluster-1# /usr/likewise/bin/lwsm restart lwio
Nogmaals, dit kan op meerdere knooppunten tegelijk worden gedaan met behulp van isi_for_array. Hieronder ziet u een voorbeeld van het opnieuw opstarten van de SMB-stack op knooppunt 1-4:
MyCluster-1# isi_for_array -n1-4 '/usr/likewise/bin/lwsm restart lwio'
Dit probleem wordt opgelost in de OneFS 9.7.1.7-code en hoger.