Koaleszer-CFIFO-Gewindesicherung
Summary: Cluster-Deadlocking durch CFIFO-Thread-Konflikt
Symptoms
Möglicherweise nicht reagierend isi Befehle, Leistungseinbußen und Clientverbindungen reagieren aufgrund von Sperrkonflikten möglicherweise nicht mehr.
Cause
In einigen seltenen Fällen kann es aufgrund von Threadkonflikten zu einem Deadlock im Cluster kommen.
Dies kann der Fall sein, wenn mehrere Threads einen Einsatz ausführen, während ein anderer Thread die Coalescer-Spülung ausführt.
Resolution
Dieses Problem wurde in 9.4.0.17+, 9.5.0.3 Hotfix 9.5.0.7 behoben.
Um zu bestätigen, dass das Problem live auftritt, überprüfen Sie auf "cfifo' Threadsperre auf dem Cluster mit dem folgenden Befehl:
# isi_for_array ‘sysctl kern.proc.all_stacks |grep cfifo’
Wenn cfifo mehr als 100.000 Ticks wartet, ist eine Panik des Knotens erforderlich, um die Sperre aufzuheben.
Beispiel--
Waiting on 0xfffff8142b2dd580 with msg "cfifo" for 32619857 ticks <------ cfifo waiting for over 100k ticks Stack: -------------------------------------------------- kernel:sched_switch+0xbcc kernel:mi_switch+0x128 kernel:sleepq_wait+0x2b kernel:_sleep+0x264 kernel:write_sleep+0x4e kernel:coalescer_insert+0x1e26 kernel:coalescer_write+0x2bfe kernel:bam_coal_write+0x64 kernel:_ifs_write_mbuf+0x6b kernel:ifs_vnop_wrapunlocked_write_mbuf+0xdc kernel:VOP_UNLOCKED_WRITE_MBUF_APV+0x93 isi_lwext.ko:lwextsvc_write+0x4ff kernel:amd64_syscall+0x380 --------------------------------------------------
Falls Bedenken bestehen, dass das oben genannte Problem auftritt, muss beim Support ein Fall mit einer vollständigen Protokollerfassung zur Überprüfung eingereicht werden.