PowerScale: Problemas de rendimiento de NFS debido a la sobrecarga del servidor ICAP
Summary: El rendimiento de NFS se ve afectado mientras la configuración del análisis antivirus "Análisis al abrir" o "Análisis al cerrar" está activada, lo que provoca la sobrecarga de los servidores ICAP. ...
Symptoms
El impacto sobre el rendimiento en NFS descrito en este artículo de la base de conocimientos se aplica a un clúster configurado con servidores ICAP. En primer lugar, compruebe la configuración del servidor antivirus ICAP:
# isi antivirus icap settings view Fail Open: Yes Glob Filters: - Glob Filters Enabled: No Glob Filters Include: No Path Prefixes: /ifs/nasprod2024/smb Repair: No Report Expiry: 1W Scan On Close: Yes <<<-- Enabled Scan On Open: Yes <<<-- Enabled Scan Cloudpool Files: No Scan Size Maximum: 100.00M Service: Yes Quarantine: Yes Truncate: No
Confirme los subprocesos de NFS en espera de "av" o "av_wait" en el script de rendimiento general.
https://confluence.cec.lab.emc.com/display/ISILON/General+Performance+Troubleshooting
>>> Wait Channel Values<<< 11 av_wait 20 kqread 20 av 4 sbwait 1 opwres 4 sigwait 107 ucond
Confirme en los mensajes de registro en el nodo afectado en el intervalo de tiempo afectado.
- Los servidores ICAP sobrecargan los mensajes en /var/log/messages
2025-05-06T17:42:20.639078-07:00 <0.5> nasprod2024-4(id4) /boot/kernel.amd64/kernel: [bam_av.c:1176](pid 14848="nfs")(tid=100543) Scan 1:155d:543d::HEAD failed with timeout (probably due to ICAP server overload); doing opdata cleanup with state: dequeued 2025-05-06T17:42:20.639138-07:00 <0.5> nasprod2024-4(id4) /boot/kernel.amd64/kernel: [bam_av.c:1176](pid 14848="nfs")(tid=100524) Scan 1:0c2e:9531::HEAD failed with timeout (probably due to ICAP server overload); doing opdata cleanup with state: dequeued
- Extracción de núcleos de Avscan y reinicio de n /var/log/messages
2025-05-06T17:00:03.571382-07:00 <0.5> nasprod2024-1(id1) /boot/kernel.amd64/kernel: /lib/libthr.so.3:_pthread_create+0x906 2025-05-06T17:00:03.571392-07:00 <0.5> nasprod2024-1(id1) /boot/kernel.amd64/kernel: -------------------------------------------------- 2025-05-06T17:00:03.571403-07:00 <0.6> nasprod2024-1(id1) /boot/kernel.amd64/kernel: pid 68624 (isi_avscan_d), jid 0, uid 0: exited on signal 11 from pid 0 (unknown) (core dumped) 2025-05-06T17:00:03.905443-07:00 <3.3> nasprod2024-1(id1) isi_avscan_d[63725]: [0x4d07b71b3000] Setting process flag P_NO_SEMLOCK for avscan 2025-05-06T17:00:03.905857-07:00 <3.4> nasprod2024-1(id1) isi_avscan_d[63725]: [0x4d07b71b3000] isi_avscan_d starting up 2025-05-06T17:00:03.949657-07:00 <3.4> nasprod2024-1(id1) isi_avscan_d[63725]: [0x4d07b71b3000] isi_avscan_d completed start up, ready...
- Los registros de Avscan muestran signos de un servidor ICAP sobrecargado
2025-05-06T17:38:58.867768-07:00 <3.6> nasprod2024-1(id1) isi_avscan_d[63725]: [0x4d07b7998200] Scan request timeout exceeded and dropped for 1:17c5:0b6e::HEAD, policy id: SCAN_ON_OPEN, report id: SCAN_ON_OPEN. 2025-05-06T17:38:58.868241-07:00 <3.6> nasprod2024-1(id1) isi_avscan_d[63725]: [0x4d07b71b4900] Scan request timeout exceeded and dropped for 1:17b7:6f7d::HEAD, policy id: SCAN_ON_OPEN, report id: SCAN_ON_OPEN. 2025-05-06T17:38:58.868439-07:00 <3.6> nasprod2024-1(id1) isi_avscan_d[63725]: [0x4d07b7997300] Scan request timeout exceeded and dropped for 1:0e78:89b3::HEAD, policy id: SCAN_ON_OPEN, report id: SCAN_ON_OPEN.
Confirme la ruta escaneada con isi_get. Por ejemplo, el LIN anterior 1:0c2e:9531 del registro de mensajes debe coincidir con una ruta de exportación NFS.
A valid path for LIN 1:0c2e:9531::HEAD is /ifs/nasprod2024/nfs/libarc-p1/mysql/#ib_16384_0.dblwr
Cause
Los servidores ICAP del cliente se sobrecargan debido al escaneo de archivos durante la apertura y el cierre. La guía ICAP recomienda una proporción de 1:1 como mínimo.
Guía de administración de la CLI de PowerScale OneFS: servidores ICAP
Resolution
Para obtener un alivio inmediato, deshabilite "escanear al abrir" y, luego, pruebe el rendimiento.
# isi antivirus icap settings modify --scan-on-open=false
Si el problema persiste, deshabilite "escanear al cerrar" y, a continuación, pruebe el rendimiento.
# isi antivirus icap settings modify --scan-on-close=false
Para una resolución permanente, y si desea habilitar ambos ajustes, aumente la cantidad de servidores ICAP.
Escanear al cerrar es la proporción recomendada de 1:1 de servidores ICAP a nodos.
Scan on open es la relación recomendada de 2:1 entre servidores ICAP y nodos.