PowerScale: NFS-kärndumpar från NFSv4 GETATTR-begäran med en ogiltig filbeskrivning.

Summary: I sällsynta fall kärndumpar NFS-processen (Network File System) kontinuerligt kärndumpar på noder på grund av en NFSv4 GETATTR-begäran med en ogiltig filbeskrivning. Problemet har endast rapporterats när arbetsflöden NFSv4-klienter använder Solaris-operativsystemet. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

NFS-processen kärndumpar och startar kontinuerligt om på flera PowerScale-noder med följande stackspårning:

2025-12-12T09:50:12.851358-08:00 <0.5> powerscale01-28(id28) /boot/kernel.amd64/kernel: [kern_sig.c:4043](pid 6400="nfs")(tid=103190) Stack trace:
2025-12-12T09:50:12.851392-08:00 <0.5> powerscale01-28(id28) /boot/kernel.amd64/kernel: Stack: --------------------------------------------------
2025-12-12T09:50:12.851397-08:00 <0.5> powerscale01-28(id28) /boot/kernel.amd64/kernel: /usr/likewise/lib/lw-svcm/nfs.so:Nfs4AttrGatherAttrs+0x516
2025-12-12T09:50:12.851401-08:00 <0.5> powerscale01-28(id28) /boot/kernel.amd64/kernel: /usr/likewise/lib/lw-svcm/nfs.so:$dtrace1150544965.Nfs4FillAttr+0x736
2025-12-12T09:50:12.851404-08:00 <0.5> powerscale01-28(id28) /boot/kernel.amd64/kernel: /usr/likewise/lib/lw-svcm/nfs.so:$dtrace1209865017.NfsProtoNfs4ProcGetattr+0x515
2025-12-12T09:50:12.851408-08:00 <0.5> powerscale01-28(id28) /boot/kernel.amd64/kernel: /usr/likewise/lib/lw-svcm/nfs.so:$dtrace1357219149.NfsProtoNfs4ProcCompound+0x18a2
2025-12-12T09:50:12.851412-08:00 <0.5> powerscale01-28(id28) /boot/kernel.amd64/kernel: /usr/likewise/lib/lw-svcm/nfs.so:$dtrace1895683854.NfsProtoNfs4Dispatch+0xa31
2025-12-12T09:50:12.851415-08:00 <0.5> powerscale01-28(id28) /boot/kernel.amd64/kernel: /usr/likewise/lib/lw-svcm/nfs.so:NfsExecContextCallback+0x61
2025-12-12T09:50:12.851419-08:00 <0.5> powerscale01-28(id28) /boot/kernel.amd64/kernel: /usr/likewise/lib/liblwsched.so.0:WorkSparkMain+0x4f
2025-12-12T09:50:12.851422-08:00 <0.5> powerscale01-28(id28) /boot/kernel.amd64/kernel: /usr/likewise/lib/liblwbase.so.0:SparkMain+0x142
2025-12-12T09:50:12.851426-08:00 <0.5> powerscale01-28(id28) /boot/kernel.amd64/kernel: --------------------------------------------------
2025-12-12T09:50:12.851429-08:00 <0.6> powerscale01-28(id28) /boot/kernel.amd64/kernel: pid 6400 (nfs), jid 0, uid 0: exited on signal 11 from pid 0 (unknown) (core dumped)

OR

2023-03-01T09:18:00.403811+01:00 <0.5> powerscale01-5(id6) /boot/kernel.amd64/kernel: [kern_sig.c:4026](pid 71661="nfs")(tid=102404) Stack trace:
2023-03-01T09:18:00.403856+01:00 <0.5> powerscale01-5(id6) /boot/kernel.amd64/kernel: Stack: --------------------------------------------------
2023-03-01T09:18:00.403868+01:00 <0.5> powerscale01-5(id6) /boot/kernel.amd64/kernel: /usr/likewise/lib/lw-svcm/nfs.so:Nfs4AttrGatherAttrs+0x50a
2023-03-01T09:18:00.403879+01:00 <0.5> powerscale01-5(id6) /boot/kernel.amd64/kernel: /usr/likewise/lib/lw-svcm/nfs.so:$dtrace1150544965.Nfs4FillAttr+0x700
2023-03-01T09:18:00.403889+01:00 <0.5> powerscale01-5(id6) /boot/kernel.amd64/kernel: /usr/likewise/lib/lw-svcm/nfs.so:$dtrace1209865017.NfsProtoNfs4ProcGetattr+0x5e7
2023-03-01T09:18:00.403900+01:00 <0.5> powerscale01-5(id6) /boot/kernel.amd64/kernel: /usr/likewise/lib/lw-svcm/nfs.so:$dtrace1357219149.NfsProtoNfs4ProcCompound+0x1721
2023-03-01T09:18:00.403911+01:00 <0.5> powerscale01-5(id6) /boot/kernel.amd64/kernel: /usr/likewise/lib/lw-svcm/nfs.so:$dtrace1895683854.NfsProtoNfs4Dispatch+0x402
2023-03-01T09:18:00.403921+01:00 <0.5> powerscale01-5(id6) /boot/kernel.amd64/kernel: /usr/likewise/lib/lw-svcm/nfs.so:$dtrace2038417139.NfsProtoNfs4CallDispatch+0xd0
2023-03-01T09:18:00.403932+01:00 <0.5> powerscale01-5(id6) /boot/kernel.amd64/kernel: /usr/likewise/lib/liblwbase.so.0:SparkMain+0x141
2023-03-01T09:18:00.403943+01:00 <0.5> powerscale01-5(id6) /boot/kernel.amd64/kernel: --------------------------------------------------
2023-03-01T09:18:00.403953+01:00 <0.6> powerscale01-5(id6) /boot/kernel.amd64/kernel: pid 71661 (nfs), uid 0: exited on signal 11 from pid 0 (unknown) (core dumped)

Cause

Det här problemet uppstår när en Solaris NFSv4 Klienten skickar en sammansatt begäran som innehåller nio åtgärder (PUTFH, SAVEFH, LOOKUP, GETFH, GETATTR, RESTOREFH, NVERIFY, GETATTR, ACCESS). Under bearbetningen av GETATTR Åtgärd som servern anropar Nfs4AttrGatherAttrs, som tar bort referenser pGattrCtx->pFilePosixInfo->Uid. I kraschdumpen pGattrCtx är en giltig pekare men pFilePosixInfo är NULL, vilket leder till ett segmenteringsfel (signal 11) och en kärndump. Felet har återskapats, spårats och en korrigering håller för närvarande på att tas fram (status pågår).

Hittills har alla rapporter på detta område hittills involverat Solaris NFSv4 Klientens arbetsflöde. PowerScale-teknikerna kan dock även replikera problemet med hjälp av andra UNIX- eller Linux-operativsystem. Det finns också belägg för att Solaris-klienter som använder autos eller automount funktionen kan vara mer benägen att orsaka problemet. 

En ny defekt har skapats för att åtgärda problemet: PSCLDF-6198: Invalid Pointer pGattrCtx->pFilePosixInfo causes a core dump.

Resolution

Permanent lösning: 
Uppgradera till en av dessa kommande OneFS-versioner som innehåller korrigeringen:

  • OneFS 9.10.1.8 ((9.10.1.8 bör vara klar i slutet av juni 2026)
  • OneFS 9.14 (utgivningsdatum väntar)


Workaround:
Tills en permanent lösning tillämpas kan följande lösningar användas för att minska effekten:

  1. Identifiera NFSv4 klienter som gör att NFS dumpas.

Om det behövs kan supporten identifiera den skyldige klientens IP-adress via de automatiskt genererade kärndumparna som finns i /var/crash på de berörda noderna. Skapa inte en kärndump manuellt. C-supporten kräver den genererade kärndumpen från problemet som hittades i /var/crash på de berörda noderna. Supporten kan skapa en konsulteskalering om hjälp behövs för att identifiera klienterna som orsakar problemet.

  1. Inaktivera autofs/automount Solaris-klienterna eftersom Dell Technologies-supporten anser att detta är relaterat till problemet. Montera i stället exporterna manuellt på Solaris-klienterna genom att konfigurera /etc/vfstab på klienten. 
  2. När Dell Technologies-supporten har identifierat klienterna som orsakar problemet kan de mildra påverkan på resten av NFS-datorerna genom att pausa 1–2 noder i NFS-poolen. Kunderna kan sedan konfigurera de problematiska Solaris-klienterna så att de ansluter direkt till IP-adresserna (i stället för att använda SmartConnect-zonnamnet eller FQDN) för de pausade noderna. Dell Technologies support kan hjälpa till med denna procedur om det behövs. När noden har pausats kan de problematiska Solaris-klienterna nu ansluta till noderna via IP-adress, medan alla NYA anslutningar till FQDN från alla dina andra NFS-klienter nu hindras från att ansluta till den här noden. Alla befintliga anslutningar till noden påverkas dock. Återigen är målet att minska effekten här, tills en korrigeringskorrigering tillämpas, i och med att endast en eller två noders NFS-daemoner nu är kärndump.

 

Steg för att pausa en nod från en SmartConnect-nätverkspool:

Med nod 26 som exempel:

# isi network pools sc-suspend-nodes groupnet0.NFS_Subnet.NFS_Pool    26   ***where 26 is lnn #26 ####

 Upprepa för varje berörd pool.

Så här återupptar du:

# isi network pools sc-resume-nodes  groupnet0.NFS_Subnet.NFS_Pool   26   ***where 26 is lnn #26 ####

Upprepa för varje berörd pool.

Affected Products

PowerScale, PowerScale OneFS, PowerScale F710
Article Properties
Article Number: 000424323
Article Type: Solution
Last Modified: 28 أبريل 2026
Version:  4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.