Dell Unity: Linux-hosts die zijn gekoppeld met NFSv4.2 op Unity met OE 5.5 veroorzaken SP-panics
Summary: In Unity 5.5 kan FS-toegang (File System) worden geboden met behulp van een NFS-koppeling (Network File System) met behulp van NFSv3- of NFSv4-protocollen voor het delen van bestanden. Dit wordt meestal gedaan voor LUN- (Logical Unity Numbers) en NFS-datastores met specifieke koppelingsparameters en vervolgens gescript voor verschillende groepen hosts. Er wordt een directory gemaakt voor het koppelpunt bij het koppelen van bestandsshares met behulp van NFSv4.2. Als aan de parameter Directory Security Label (sec_label) geen data zijn toegewezen, kunnen de Unity Service Processors (SP) in paniek raken en onverwacht opnieuw opstarten. ...
Symptoms
In Unity OE 5.5 is ondersteuning voor NFSv4.2 toegevoegd met modus- en sec_label-parameters die moeten worden gebruikt tijdens het NFS-koppelingsproces.
- In bepaalde NFSv4.2-scenario's voor het koppelen van scripts voor het maken van een directory voor het koppelpunt, kunnen de Unity-systeemprocessors (SP) een SIGSEVV-paniek ondervinden en onverwacht opnieuw opstarten als er geen data aan de sec_label zijn toegewezen.
- Een of beide SP's kunnen in paniek raken als gevolg van een racevoorwaarde tussen een naamswijziging en een directoryvermelding. Dit kan ertoe leiden dat het systeem uitvalt en een of beide SP's in de reddingsmodus komen.
Voorbeeld van panic-uitvoer uit Unity-logboeken:
B 05/14/25 19:01:09 CSX RT: panic requested at: <file-unknown>:0 (thread: 139634334762752 aka 139634334762752) [PID:7138 TID:9862 CORE:1 [csx_ic_std.x] [nfs09_007] [05/14/2025 19:01:09 UTC]] (panic action:DEFAULT expr:<no-expr> flags:-) [info:0] B 05/14/25 19:01:09 CSX RT: Fatal: Process received SIGSEGV: B 05/14/25 19:01:09 SIGSEGV(SEGV_MAPERR)@0x20 B 05/14/25 19:01:09 CSX RT: panic backtrace: [26ec0700] 00007f159e87ab34 <csx_rt_proc_request_backtrace +0x00000154> (sp=00007f159eb45440) proc=7f159e87a9e0-7f159e87b01d csx_urt.so B 05/14/25 19:01:09 CSX RT: panic backtrace: [26ec0700] 00007f159e846a27 <csx_rt_assert_request_panic +0x000000b7> (sp=00007f159eb46380) proc=7f159e846970-7f159e846a3b csx_urt.so B 05/14/25 19:01:09 CSX RT: panic backtrace: [26ec0700] 00007f159e878727 <csx_rt_proc_int_handle_fatal_signal +0x000002d7> (sp=00007f159eb464a0) proc=7f159e878450-7f159e8788f2 csx_urt.so B 05/14/25 19:01:09 CSX RT: panic backtrace: [26ec0700] 00007f159e87d543 <csx_rt_proc_int_handle_sigsegv +0x000001b3> (sp=00007f159eb46520) proc=7f159e87d390-7f159e87d597 csx_urt.so B 05/14/25 19:01:09 CSX RT: panic backtrace: [26ec0700] 00007f1545d20ea9 <_ZN13nfs4_attrhold17nfs4SetattrVerifyEjRPj+0x00000049> (sp=00007eff26ebed10) proc=7f1545d20e60-7f1545d20f90 cdx.so B 05/14/25 19:01:09 CSX RT: panic backtrace: [26ec0700] 00007f1545d217be <_Z13nfs4_secLabeliiP14nfs4_attr_infoP8nfs4_ctxP13nfs4_attrholdP15File_NamingNodeP17Access_Credential+0x0000075e> (sp=00007eff26ebed60) proc=7f1545d21060-7f1545d21823 cdx.so
Opmerking: De panics treden niet op bij elke NFSv4.2-montagepoging en sommige werken probleemloos.
Als SP-panics optreden, neemt u contact op met Dell Support en raadpleegt u dit artikel om de status van het systeem te onderzoeken. Probeer geen problemen met de SP's op te lossen zonder begeleiding van support.
Cause
De huidige Unity OE 5.5-code kan het kenmerk sec_label niet verwerken zonder dat er data zijn toegewezen. Als gevolg hiervan krijgt de SP toegang tot een null-geheugenaanwijzer, wat een SIGSEVV-paniek veroorzaakt. Bovendien kan code 5.5 een racevoorwaarde tegenkomen tussen een directoryvermelding en een hernoemingsbewerking, wat resulteert in geblokkeerde threads en een time-outpaniek van de waakhond.
Resolution
Oplossing:
De racevoorwaarde is opgelost in Dell Unity OE versie 5.5.2. Upgrade naar deze versie om dit probleem op te lossen.
Het probleem met de lege sec_label wordt nog steeds aangepakt door Engineering. Bekijk dit Knowledge Base-artikel voor verdere updates. In de tussentijd kunnen de onderstaande tijdelijke oplossingen het probleem met de lege sec_label omzeilen.
Tijdelijke oplossing:
Gebruik het volgende artikel om het NFSv4.2-beveiligingslabel uit te schakelen:
- Dell Unity: Beveiligingslabel uitschakelen via NFS op Unity OE 5.5 (op te lossen door gebruiker) (Meld u aan als een geregistreerde Dell Support gebruiker om dit artikel te lezen.)
Het artikel bevat ook de volgende tijdelijke oplossingen, waarmee ook beide problemen kunnen worden opgelost:
- Koppel de Linux-servers alleen met NFSv3, NFSv4 of NFSv4.1
- Parameter om de maximaal ondersteunde NFSv4-versie te downgraden naar 4.1
Additional Information
Een NFSv4.2-koppelpuntdirectory "create request" op een Linux-host die modus- en sec_label-informatie biedt, heeft op de volgende manieren invloed op de aanvraag:
- Modus: Deze parameter specificeert de machtigingen voor de nieuwe map. Het definieert de lees-, schrijf- en uitvoeringsmachtigingen voor de eigenaar, groep en anderen. Een modus van 0755 verleent bijvoorbeeld lees-, schrijf- en uitvoeringsmachtigingen aan de eigenaar, en lees- en uitvoeringsmachtigingen aan de groep en anderen. Dit zorgt ervoor dat de directory wordt gemaakt met de juiste toegangscontroles.
- Sec_label: Deze parameter wordt gebruikt om beveiligingslabels toe te passen op de directory. Sec_labels maken deel uit van het Mandatory Access Control (MAC)-systeem, dat fijnmaziger toegangscontrole biedt in vergelijking met traditionele Discretionary Access Control (DAC). Wanneer een map wordt gemaakt met een sec_label, slaat de NFS-server deze labels op en haalt deze op, zodat de map voldoet aan het opgegeven beveiligingsbeleid.
Dit is handig in omgevingen die strikte naleving van de beveiliging vereisen.
In dit artikel wordt besproken wat een SIGSEGV geheugenpaniek is: Dell Unity: Storageverwerker heeft panic ondervonden met oorzaak SIGSEGV