PowerScale: NFS-kärndumpar från NFSv4 GETATTR-begäran med en ogiltig filbeskrivning.

Summary: I sällsynta fall kärndumpar NFS-processen (Network File System) kontinuerligt kärndumpar på noder på grund av en NFSv4 GETATTR-begäran med en ogiltig filbeskrivning. Problemet har endast rapporterats när arbetsflöden NFSv4-klienter använder Solaris-operativsystemet. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

NFS-processen kärndumpar och startar kontinuerligt om på flera PowerScale-noder med följande stackspårning:

2025-12-12T09:50:12.851358-08:00 <0.5> powerscale01-28(id28) /boot/kernel.amd64/kernel: [kern_sig.c:4043](pid 6400="nfs")(tid=103190) Stack trace:
2025-12-12T09:50:12.851392-08:00 <0.5> powerscale01-28(id28) /boot/kernel.amd64/kernel: Stack: --------------------------------------------------
2025-12-12T09:50:12.851397-08:00 <0.5> powerscale01-28(id28) /boot/kernel.amd64/kernel: /usr/likewise/lib/lw-svcm/nfs.so:Nfs4AttrGatherAttrs+0x516
2025-12-12T09:50:12.851401-08:00 <0.5> powerscale01-28(id28) /boot/kernel.amd64/kernel: /usr/likewise/lib/lw-svcm/nfs.so:$dtrace1150544965.Nfs4FillAttr+0x736
2025-12-12T09:50:12.851404-08:00 <0.5> powerscale01-28(id28) /boot/kernel.amd64/kernel: /usr/likewise/lib/lw-svcm/nfs.so:$dtrace1209865017.NfsProtoNfs4ProcGetattr+0x515
2025-12-12T09:50:12.851408-08:00 <0.5> powerscale01-28(id28) /boot/kernel.amd64/kernel: /usr/likewise/lib/lw-svcm/nfs.so:$dtrace1357219149.NfsProtoNfs4ProcCompound+0x18a2
2025-12-12T09:50:12.851412-08:00 <0.5> powerscale01-28(id28) /boot/kernel.amd64/kernel: /usr/likewise/lib/lw-svcm/nfs.so:$dtrace1895683854.NfsProtoNfs4Dispatch+0xa31
2025-12-12T09:50:12.851415-08:00 <0.5> powerscale01-28(id28) /boot/kernel.amd64/kernel: /usr/likewise/lib/lw-svcm/nfs.so:NfsExecContextCallback+0x61
2025-12-12T09:50:12.851419-08:00 <0.5> powerscale01-28(id28) /boot/kernel.amd64/kernel: /usr/likewise/lib/liblwsched.so.0:WorkSparkMain+0x4f
2025-12-12T09:50:12.851422-08:00 <0.5> powerscale01-28(id28) /boot/kernel.amd64/kernel: /usr/likewise/lib/liblwbase.so.0:SparkMain+0x142
2025-12-12T09:50:12.851426-08:00 <0.5> powerscale01-28(id28) /boot/kernel.amd64/kernel: --------------------------------------------------
2025-12-12T09:50:12.851429-08:00 <0.6> powerscale01-28(id28) /boot/kernel.amd64/kernel: pid 6400 (nfs), jid 0, uid 0: exited on signal 11 from pid 0 (unknown) (core dumped)

OR

2023-03-01T09:18:00.403811+01:00 <0.5> powerscale01-5(id6) /boot/kernel.amd64/kernel: [kern_sig.c:4026](pid 71661="nfs")(tid=102404) Stack trace:
2023-03-01T09:18:00.403856+01:00 <0.5> powerscale01-5(id6) /boot/kernel.amd64/kernel: Stack: --------------------------------------------------
2023-03-01T09:18:00.403868+01:00 <0.5> powerscale01-5(id6) /boot/kernel.amd64/kernel: /usr/likewise/lib/lw-svcm/nfs.so:Nfs4AttrGatherAttrs+0x50a
2023-03-01T09:18:00.403879+01:00 <0.5> powerscale01-5(id6) /boot/kernel.amd64/kernel: /usr/likewise/lib/lw-svcm/nfs.so:$dtrace1150544965.Nfs4FillAttr+0x700
2023-03-01T09:18:00.403889+01:00 <0.5> powerscale01-5(id6) /boot/kernel.amd64/kernel: /usr/likewise/lib/lw-svcm/nfs.so:$dtrace1209865017.NfsProtoNfs4ProcGetattr+0x5e7
2023-03-01T09:18:00.403900+01:00 <0.5> powerscale01-5(id6) /boot/kernel.amd64/kernel: /usr/likewise/lib/lw-svcm/nfs.so:$dtrace1357219149.NfsProtoNfs4ProcCompound+0x1721
2023-03-01T09:18:00.403911+01:00 <0.5> powerscale01-5(id6) /boot/kernel.amd64/kernel: /usr/likewise/lib/lw-svcm/nfs.so:$dtrace1895683854.NfsProtoNfs4Dispatch+0x402
2023-03-01T09:18:00.403921+01:00 <0.5> powerscale01-5(id6) /boot/kernel.amd64/kernel: /usr/likewise/lib/lw-svcm/nfs.so:$dtrace2038417139.NfsProtoNfs4CallDispatch+0xd0
2023-03-01T09:18:00.403932+01:00 <0.5> powerscale01-5(id6) /boot/kernel.amd64/kernel: /usr/likewise/lib/liblwbase.so.0:SparkMain+0x141
2023-03-01T09:18:00.403943+01:00 <0.5> powerscale01-5(id6) /boot/kernel.amd64/kernel: --------------------------------------------------
2023-03-01T09:18:00.403953+01:00 <0.6> powerscale01-5(id6) /boot/kernel.amd64/kernel: pid 71661 (nfs), uid 0: exited on signal 11 from pid 0 (unknown) (core dumped)

Cause

Det här problemet uppstår när en Solaris NFSv4 Klienten skickar en NFSv4 GETATTR begäran med en NULL- eller ogiltig filbeskrivning.

Detta gör att NFS-processen kärndumpar och startas om på PowerScale-noden och hanterar ett rotfilshandtag på en sekund GETATTRMen pExecContext > pExport är inte NULL.

Hittills har alla rapporter på detta område hittills involverat Solaris NFSv4 Klientens arbetsflöde. PowerScale-teknikerna kan dock även replikera problemet med hjälp av andra UNIX- eller Linux-operativsystem. Det finns också belägg för att Solaris-klienter som använder autos eller automount funktionen kan vara mer benägen att orsaka problemet. 

En ny defekt har skapats för att åtgärda problemet: PSCLDF-6198: Invalid Pointer pGattrCtx->pFilePosixInfo causes a core dump.

Resolution

Permanent lösning: 
Uppgradera till en OneFS-version som innehåller korrigeringen. PowerScale Engineering arbetar på en korrigeringsfil för problemet. Det finns ingen exakt tidpunkt för lansering.

Workaround:
Tills en permanent lösning tillämpas kan följande lösningar användas för att minska effekten:

  1. Identifiera NFSv4 klienter som gör att NFS dumpas.

Om det behövs kan supporten identifiera den skyldige klientens IP-adress via de automatiskt genererade kärndumparna som finns i /var/crash på de berörda noderna. Skapa inte en kärndump manuellt. C-supporten kräver den genererade kärndumpen från problemet som hittades i /var/crash på de berörda noderna. Supporten kan skapa en konsulteskalering om hjälp behövs för att identifiera klienterna som orsakar problemet.

  1. Inaktivera autofs/automount Solaris-klienterna eftersom Dell Technologies-supporten anser att detta är relaterat till problemet. Montera i stället exporterna manuellt på Solaris-klienterna genom att konfigurera /etc/vfstab på klienten. 
  2. När Dell Technologies-supporten har identifierat klienterna som orsakar problemet kan de mildra påverkan på resten av NFS-datorerna genom att pausa 1–2 noder i NFS-poolen. Kunderna kan sedan konfigurera de problematiska Solaris-klienterna så att de ansluter direkt till IP-adresserna (i stället för att använda SmartConnect-zonnamnet eller FQDN) för de pausade noderna. Dell Technologies support kan hjälpa till med denna procedur om det behövs. När noden har pausats kan de problematiska Solaris-klienterna nu ansluta till noderna via IP-adress, medan alla NYA anslutningar till FQDN från alla dina andra NFS-klienter nu hindras från att ansluta till den här noden. Alla befintliga anslutningar till noden påverkas dock. Återigen är målet att minska effekten här, tills en korrigeringskorrigering tillämpas, i och med att endast en eller två noders NFS-daemoner nu är kärndump.

 

Steg för att pausa en nod från en SmartConnect-nätverkspool:

Med nod 26 som exempel:

# isi network pools sc-suspend-nodes groupnet0.NFS_Subnet.NFS_Pool    26   ***where 26 is lnn #26 ####

 Upprepa för varje berörd pool.

Så här återupptar du:

# isi network pools sc-resume-nodes  groupnet0.NFS_Subnet.NFS_Pool   26   ***where 26 is lnn #26 ####

Upprepa för varje berörd pool.

Affected Products

PowerScale, PowerScale OneFS, PowerScale F710
Article Properties
Article Number: 000424323
Article Type: Solution
Last Modified: 20 فبراير 2026
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.