Dell Unity: Linux-Hosts, die mit NFSv4.2 auf Unity mit OE 5.5 gemountet sind, verursachen SP-Fehler
Summary: In Unity 5.5 kann der Zugriff auf das Dateisystem (FS) mithilfe eines NFS-Mount (Network File System) mithilfe der NFSv3- oder NFSv4-Dateifreigabeprotokolle bereitgestellt werden. Dies geschieht in der Regel für LUNs (Logical Unity Numbers) und NFS-Datenspeicher mit bestimmten Mount-Parametern und wird dann für verschiedene Gruppen von Hosts als Skript erstellt. Beim Mounten von Dateifreigaben mit NFSv4.2 wird ein Verzeichnis für den Einhängepunkt erstellt. Wenn dem Parameter sec_label (Directory Security Label) keine Daten zugewiesen sind, können die Unity-Serviceprozessoren (SP) einen Fehler verursachen und unerwartet neu starten. ...
Symptoms
In Unity OE 5.5 wurde Unterstützung für NFSv4.2 mit Modus- und sec_label-Parametern hinzugefügt, die während des NFS-Mount-Prozesses verwendet werden sollen.
- Wenn dem sec_label in bestimmten NFSv4.2-Skript-Mount-Szenarien zum Erstellen eines Verzeichnisses für den Mount-Punkt keine Daten zugewiesen sind, kann bei Unity-Systemprozessoren (SP) ein SIGSEGV-Fehler auftreten und unerwartet neu gestartet werden, um ein Verzeichnis für den Mount-Punkt zu erstellen.
- Bei einem oder beiden SPs kann es aufgrund einer Race-Bedingung zwischen einer Umbenennung und einer Verzeichnisauflistung zu einem Fehler kommen. Dies kann dazu führen, dass das System ausfällt und ein oder beide SPs in den Rettungsmodus wechseln.
Beispiel für eine Fehlerausgabe aus Unity-Protokollen:
B 05/14/25 19:01:09 CSX RT: panic requested at: <file-unknown>:0 (thread: 139634334762752 aka 139634334762752) [PID:7138 TID:9862 CORE:1 [csx_ic_std.x] [nfs09_007] [05/14/2025 19:01:09 UTC]] (panic action:DEFAULT expr:<no-expr> flags:-) [info:0] B 05/14/25 19:01:09 CSX RT: Fatal: Process received SIGSEGV: B 05/14/25 19:01:09 SIGSEGV(SEGV_MAPERR)@0x20 B 05/14/25 19:01:09 CSX RT: panic backtrace: [26ec0700] 00007f159e87ab34 <csx_rt_proc_request_backtrace +0x00000154> (sp=00007f159eb45440) proc=7f159e87a9e0-7f159e87b01d csx_urt.so B 05/14/25 19:01:09 CSX RT: panic backtrace: [26ec0700] 00007f159e846a27 <csx_rt_assert_request_panic +0x000000b7> (sp=00007f159eb46380) proc=7f159e846970-7f159e846a3b csx_urt.so B 05/14/25 19:01:09 CSX RT: panic backtrace: [26ec0700] 00007f159e878727 <csx_rt_proc_int_handle_fatal_signal +0x000002d7> (sp=00007f159eb464a0) proc=7f159e878450-7f159e8788f2 csx_urt.so B 05/14/25 19:01:09 CSX RT: panic backtrace: [26ec0700] 00007f159e87d543 <csx_rt_proc_int_handle_sigsegv +0x000001b3> (sp=00007f159eb46520) proc=7f159e87d390-7f159e87d597 csx_urt.so B 05/14/25 19:01:09 CSX RT: panic backtrace: [26ec0700] 00007f1545d20ea9 <_ZN13nfs4_attrhold17nfs4SetattrVerifyEjRPj+0x00000049> (sp=00007eff26ebed10) proc=7f1545d20e60-7f1545d20f90 cdx.so B 05/14/25 19:01:09 CSX RT: panic backtrace: [26ec0700] 00007f1545d217be <_Z13nfs4_secLabeliiP14nfs4_attr_infoP8nfs4_ctxP13nfs4_attrholdP15File_NamingNodeP17Access_Credential+0x0000075e> (sp=00007eff26ebed60) proc=7f1545d21060-7f1545d21823 cdx.so
Hinweis: Die Fehler treten nicht bei jedem NFSv4.2-Mountversuch auf und einige funktionieren problemlos.
Wenn SP-Fehler auftreten, wenden Sie sich an den Dell Support und lesen Sie diesen Artikel, um den Status des Systems zu untersuchen. Versuchen Sie nicht, ein Troubleshooting der SPs ohne Anleitung des Supports durchzuführen.
Cause
Der aktuelle Unity OE 5.5-Code kann das Attribut sec_label ohne zugewiesene Daten nicht verarbeiten. Infolgedessen greift der SP auf einen Null-Speicherzeiger zu, was zu einem SIGSEGV-Fehler führt. Darüber hinaus kann es bei 5.5-Code zu einer Wettlaufsituation zwischen einer Verzeichnisauflistung und einem Umbenennungsvorgang kommen, was zu blockierten Threads und einem Watchdog-Timeout-Fehler führt.
Resolution
Fehlerbehebung:
Die Race-Bedingung wurde in der Dell Unity OE-Version 5.5.2 behoben. Führen Sie ein Upgrade auf diese Version durch, um dieses Problem zu beheben.
Das Problem mit dem leeren sec_label wird noch von der Technikabteilung behoben. Weitere Updates finden Sie in diesem Wissensdatenbank-Artikel. In der Zwischenzeit können Sie das Problem der leeren sec_label mit den folgenden Workarounds umgehen.
Problemumgehung:
Verwenden Sie den folgenden Artikel, um die NFSv4.2-Sicherheitskennzeichnung zu deaktivieren:
- Dell Unity: Deaktivieren des Sicherheitsetiketts über NFS auf Unity OE 5.5 (von NutzerInnen korrigierbar) (Anmeldung als registrierter Dell Support-Nutzer erforderlich, um diesen Artikel anzuzeigen.)
Der Artikel zeigt auch die folgenden Problemumgehungen, die auch diese beiden Probleme umgehen:
- Mounten Sie die Linux-Server nur mit NFSv3, NFSv4 oder NFSv4.1
- Parameter für das Downgrade der maximal unterstützten NFSv4-Version auf 4.1
Additional Information
Ein NFSv4.2-Einhängepunktverzeichnis "create request" auf einem Linux-Host, der Modus- und sec_label Informationen bereitstellt, wirkt sich auf folgende Weise auf die Anforderung aus:
- Modus: Dieser Parameter gibt die Berechtigungen für das neue Verzeichnis an. Es definiert die Lese-, Schreib- und Ausführungsberechtigungen für den Besitzer, die Gruppe und andere. Ein Modus von 0755 gewährt z. B. Lese-, Schreib- und Ausführungsberechtigungen für den Besitzer und Lese- und Ausführungsberechtigungen für die Gruppe und andere. Dadurch wird sichergestellt, dass das Verzeichnis mit den richtigen Zugriffskontrollen erstellt wird.
- Sec_label: Dieser Parameter wird verwendet, um Sicherheitsetiketten auf das Verzeichnis anzuwenden. Sec_labels sind Teil des MAC-Systems (Mandatory Access Control), das im Vergleich zur herkömmlichen DAC (Discretionary Access Control) eine detailliertere Zugriffskontrolle bietet. Wenn ein Verzeichnis mit einer sec_label erstellt wird, speichert und ruft der NFS-Server diese Bezeichnungen ab, um sicherzustellen, dass das Verzeichnis den angegebenen Sicherheits-Policies entspricht.
Dies ist nützlich in Umgebungen, in denen strenge Sicherheitscompliance erforderlich ist.
In diesem Artikel wird erläutert, was ein SIGSEGV-Speicherfehler ist: Dell Unity: Beim Storage-Prozessor ist ein Fehler mit der Ursache SIGSEGV aufgetreten.