PowerScale: NFS-ydinvedokset NFSv4 GETATTR -pyynnöstä ja virheellinen tiedoston kuvaus.

Summary: Joskus NFS (Network File System) -prosessi tekee solmuille jatkuvasti ydinvedoksia, jotka johtuvat NFSv4 GETATTR -pyynnöstä, jonka tiedostokuvaaja on virheellinen. Ongelmasta on ilmoitettu vain, kun työnkulkujen NFSv4-asiakkaat käyttävät Solaris-käyttöjärjestelmää. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

NFS-prosessi käynnistää jatkuvasti ydinvedoksia ja uudelleenkäynnistyy useissa PowerScale-solmuissa seuraavan pinon jäljityksen avulla:

2025-12-12T09:50:12.851358-08:00 <0.5> powerscale01-28(id28) /boot/kernel.amd64/kernel: [kern_sig.c:4043](pid 6400="nfs")(tid=103190) Stack trace:
2025-12-12T09:50:12.851392-08:00 <0.5> powerscale01-28(id28) /boot/kernel.amd64/kernel: Stack: --------------------------------------------------
2025-12-12T09:50:12.851397-08:00 <0.5> powerscale01-28(id28) /boot/kernel.amd64/kernel: /usr/likewise/lib/lw-svcm/nfs.so:Nfs4AttrGatherAttrs+0x516
2025-12-12T09:50:12.851401-08:00 <0.5> powerscale01-28(id28) /boot/kernel.amd64/kernel: /usr/likewise/lib/lw-svcm/nfs.so:$dtrace1150544965.Nfs4FillAttr+0x736
2025-12-12T09:50:12.851404-08:00 <0.5> powerscale01-28(id28) /boot/kernel.amd64/kernel: /usr/likewise/lib/lw-svcm/nfs.so:$dtrace1209865017.NfsProtoNfs4ProcGetattr+0x515
2025-12-12T09:50:12.851408-08:00 <0.5> powerscale01-28(id28) /boot/kernel.amd64/kernel: /usr/likewise/lib/lw-svcm/nfs.so:$dtrace1357219149.NfsProtoNfs4ProcCompound+0x18a2
2025-12-12T09:50:12.851412-08:00 <0.5> powerscale01-28(id28) /boot/kernel.amd64/kernel: /usr/likewise/lib/lw-svcm/nfs.so:$dtrace1895683854.NfsProtoNfs4Dispatch+0xa31
2025-12-12T09:50:12.851415-08:00 <0.5> powerscale01-28(id28) /boot/kernel.amd64/kernel: /usr/likewise/lib/lw-svcm/nfs.so:NfsExecContextCallback+0x61
2025-12-12T09:50:12.851419-08:00 <0.5> powerscale01-28(id28) /boot/kernel.amd64/kernel: /usr/likewise/lib/liblwsched.so.0:WorkSparkMain+0x4f
2025-12-12T09:50:12.851422-08:00 <0.5> powerscale01-28(id28) /boot/kernel.amd64/kernel: /usr/likewise/lib/liblwbase.so.0:SparkMain+0x142
2025-12-12T09:50:12.851426-08:00 <0.5> powerscale01-28(id28) /boot/kernel.amd64/kernel: --------------------------------------------------
2025-12-12T09:50:12.851429-08:00 <0.6> powerscale01-28(id28) /boot/kernel.amd64/kernel: pid 6400 (nfs), jid 0, uid 0: exited on signal 11 from pid 0 (unknown) (core dumped)

OR

2023-03-01T09:18:00.403811+01:00 <0.5> powerscale01-5(id6) /boot/kernel.amd64/kernel: [kern_sig.c:4026](pid 71661="nfs")(tid=102404) Stack trace:
2023-03-01T09:18:00.403856+01:00 <0.5> powerscale01-5(id6) /boot/kernel.amd64/kernel: Stack: --------------------------------------------------
2023-03-01T09:18:00.403868+01:00 <0.5> powerscale01-5(id6) /boot/kernel.amd64/kernel: /usr/likewise/lib/lw-svcm/nfs.so:Nfs4AttrGatherAttrs+0x50a
2023-03-01T09:18:00.403879+01:00 <0.5> powerscale01-5(id6) /boot/kernel.amd64/kernel: /usr/likewise/lib/lw-svcm/nfs.so:$dtrace1150544965.Nfs4FillAttr+0x700
2023-03-01T09:18:00.403889+01:00 <0.5> powerscale01-5(id6) /boot/kernel.amd64/kernel: /usr/likewise/lib/lw-svcm/nfs.so:$dtrace1209865017.NfsProtoNfs4ProcGetattr+0x5e7
2023-03-01T09:18:00.403900+01:00 <0.5> powerscale01-5(id6) /boot/kernel.amd64/kernel: /usr/likewise/lib/lw-svcm/nfs.so:$dtrace1357219149.NfsProtoNfs4ProcCompound+0x1721
2023-03-01T09:18:00.403911+01:00 <0.5> powerscale01-5(id6) /boot/kernel.amd64/kernel: /usr/likewise/lib/lw-svcm/nfs.so:$dtrace1895683854.NfsProtoNfs4Dispatch+0x402
2023-03-01T09:18:00.403921+01:00 <0.5> powerscale01-5(id6) /boot/kernel.amd64/kernel: /usr/likewise/lib/lw-svcm/nfs.so:$dtrace2038417139.NfsProtoNfs4CallDispatch+0xd0
2023-03-01T09:18:00.403932+01:00 <0.5> powerscale01-5(id6) /boot/kernel.amd64/kernel: /usr/likewise/lib/liblwbase.so.0:SparkMain+0x141
2023-03-01T09:18:00.403943+01:00 <0.5> powerscale01-5(id6) /boot/kernel.amd64/kernel: --------------------------------------------------
2023-03-01T09:18:00.403953+01:00 <0.6> powerscale01-5(id6) /boot/kernel.amd64/kernel: pid 71661 (nfs), uid 0: exited on signal 11 from pid 0 (unknown) (core dumped)

Cause

Ongelma ilmenee, kun Solaris NFSv4 Asiakas lähettää NFSv4 GETATTR pyyntö, jossa on NULL- tai Virheellinen-tiedoston kuvaus.

Tämä aiheuttaa sen, että NFS-prosessi tyhjenee ja käynnistyy uudelleen PowerScale-solmussa, joka käsittelee juuritiedoston kahvaa sekunnissa GETATTRMutta pExecContext > pExport ei ole NULL.

Tähän mennessä kaikki tätä asiaa koskevat mietinnöt ovat koskeneet Solarista. NFSv4 asiakkaan työnkulku. PowerScale-suunnittelijat voivat kuitenkin toistaa ongelman myös muissa UNIX- tai Linux-käyttöjärjestelmissä. Näyttö osoittaa myös, että Solaris-asiakkaat, jotka käyttävät autos tai automount Ominaisuus voi olla alttiimpi aiheuttamaan ongelman. 

Ongelman korjaamiseksi on luotu uusi vika: PSCLDF-6198: Invalid Pointer pGattrCtx->pFilePosixInfo causes a core dump.

Resolution

Pysyvä ratkaisu: 
Päivitä OneFS-versioon, joka sisältää korjauksen. PowerScale-suunnittelu työstää parhaillaan korjaustiedostoa ongelmaan. Julkaisulle ei ole tarkkaa aikaa.

Workaround:
Kunnes pysyvä ratkaisu on otettu käyttöön, vaikutusta voidaan lieventää seuraavilla kiertotavoilla:

  1. Tunnista NFSv4 asiakkaat, jotka aiheuttavat NFS: n ydindumpin.

Tarvittaessa tuki voi tunnistaa syyllisen asiakkaan IP-osoitteen automaattisesti luotujen ydinvedosten avulla, jotka löytyvät /var/crash solmuissa, joita asia koskee. Älä luo ydinvedosta manuaalisesti. C Tuki edellyttää luotua ydinvedosta haavoittuvuudesta, joka löytyy /var/crash solmuissa, joita asia koskee. Tuki voi luoda konsultaatioeskaloinnin, jos apua tarvitaan ongelman aiheuttavien asiakkaiden tunnistamisessa.

  1. Poista käytöstä autofs/automount toimintaa Solaris-työasemissa, koska Dell Technologiesin tuki uskoo tämän liittyvän ongelmaan. Ota sen sijaan viennit manuaalisesti käyttöön Solaris-työasemilla määrittämällä /etc/vfstab asiakkaalla. 
  2. Kun Dell Technologiesin tuki on tunnistanut ongelman aiheuttavat asiakkaat, se voi lieventää vaikutusta muihin NFS-koneisiin keskeyttämällä 1–2 solmun käytön NFS-varannossa. Asiakkaat voivat sitten määrittää ongelmalliset Solaris-asiakkaat muodostamaan yhteyden suoraan keskeytettyjen solmujen IP-osoitteisiin (SmartConnect-vyöhykkeen nimen tai FQDN:n käyttämisen sijaan). Dell Technologies -tuki voi tarvittaessa auttaa tässä toimenpiteessä. Kun solmu on keskeytetty, ongelmalliset Solaris-asiakkaat voivat nyt muodostaa yhteyden solmuihin IP-osoitteen perusteella, kun taas kaikkien muiden NFS-asiakkaidesi UUDET yhteydet FQDN:ään eivät nyt voi muodostaa yhteyttä tähän solmuun. Tämä vaikuttaa kuitenkin kaikkiin olemassa oleviin yhteyksiin solmuun. Tavoitteena on jälleen vähentää vaikutusta täällä, kunnes korjauskorjaus otetaan käyttöön, koska vain yhden tai kahden solmun NFS-demonit ovat nyt ydinvedos.

 

Vaiheet solmun keskeyttämiseksi SmartConnect-verkkovarannosta:

Solmun 26 käyttäminen esimerkkinä:

# isi network pools sc-suspend-nodes groupnet0.NFS_Subnet.NFS_Pool    26   ***where 26 is lnn #26 ####

 Toista jokaiselle poolille, jota ongelma koskee.

Jatkaminen:

# isi network pools sc-resume-nodes  groupnet0.NFS_Subnet.NFS_Pool   26   ***where 26 is lnn #26 ####

Toista jokaiselle poolille, jota ongelma koskee.

Affected Products

PowerScale, PowerScale OneFS, PowerScale F710
Article Properties
Article Number: 000424323
Article Type: Solution
Last Modified: 20 فبراير 2026
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.