Las tareas de mantenimiento de Avamar fallan con "MSG_ERR_DISKFULL" debido a la capacidad del sistema operativo de la partición de datos >89 %
Summary: La capacidad del sistema operativo supera los límites recomendados, lo que provoca la falla de las tareas de mantenimiento. Esto se debe a una cantidad excesiva de cambios de los clientes de respaldo. ...
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
Los cambios repentinos y grandes en los datos respaldados por un cliente Avamar pueden tener un impacto negativo en el sistema. Si se agregan o eliminan demasiados datos de Avamar en un momento determinado, la capacidad del sistema operativo puede aumentar, lo que provoca que el mantenimiento falle con MSG_ERR_DISKFULL.
Los puntos de control rastrean los cambios en Avamar de modo que, si se necesita una reversión, Avamar se pueda devolver a ese punto en el tiempo. Cuando se agrega o se elimina una gran cantidad de datos, el punto de control se vuelve más grande y consume espacio adicional en el sistema operativo.
Tenga en cuenta a continuación cómo las actividades de mantenimiento (recolección de elementos no utilizados y puntos de control) fallan con MSG_ERR_DISKFULL.
Los puntos de control rastrean los cambios en Avamar de modo que, si se necesita una reversión, Avamar se pueda devolver a ese punto en el tiempo. Cuando se agrega o se elimina una gran cantidad de datos, el punto de control se vuelve más grande y consume espacio adicional en el sistema operativo.
Tenga en cuenta a continuación cómo las actividades de mantenimiento (recolección de elementos no utilizados y puntos de control) fallan con MSG_ERR_DISKFULL.
status.dpn
Wed Jul 27 17:58:15 IST 2016 [XX.XXX.XX.XX] Wed Jul 27 12:28:15 2016 UTC (Initialized Thu Sep 25 01:15:04 2014 UTC)
Node IP Address Version State Runlevel Srvr+Root+User Dis Suspend Load UsedMB Errlen %Full Percent Full and Stripe Status by Disk
0.0 XX.XXX.XX.XX 7.0.2-43 ONLINE fullaccess mhpu+0hpu+0000 1 true 0.46 6984 12272277 64.1% 64%(onl:445) 64%(onl:443) 64%(onl:444) 64%(onl:445) 64%(onl:443) 64%(onl:444) 64%(onl:447) 64%(onl:444) 64%(onl:444) 64%(onl:446) 64%(onl:444) 64%(onl:446)
Srvr+Root+User Modes = migrate + hfswriteable + persistwriteable + useraccntwriteable
All reported states=(ONLINE), runlevels=(fullaccess), modes=(mhpu+0hpu+0000)
System-Status: ok
Access-Status: admin
Checkpoint failed with result MSG_ERR_DISKFULL : cp.20160726183227 started Wed Jul 27 00:02:57 2016 ended Wed Jul 27 00:02:57 2016, completed 0 of 5335 stripes
Last GC: finished Wed Jul 27 15:09:55 2016 after 00m 30s >> recovered 0.00 KB (MSG_ERR_DISKFULL)
Last hfscheck: finished Mon May 23 00:25:47 2016 after 23m 13s >> checked 1359 of 1359 stripes (OK)
Maintenance windows scheduler capacity profile is active.
WARNING: Scheduler is STOPPED.
Next backup window start time: Thu Jul 28 10:00:00 2016 IST
Next maintenance window start time: Thu Jul 28 00:00:00 2016 IST
El servidor Avamar tiene una capacidad de usuario muy alta y una alta capacidad del sistema operativo.
mccli server show-prop
admin@avamar:~/>: mccli server show-prop
0,23000,CLI command completed successfully.
Attribute Value
-------------------------------------------- ----------------------------
State Suspended
Active sessions 0
Total capacity 11.6 TB
Capacity used 11.6 TB
Server utilization 98.9%
Bytes protected (client pre-comp size) 3.1 TB
Bytes protected quota (client pre-comp size) Not configured
License expiration Never
Time since Server initialization 3088 days 17h:48m
Last checkpoint 2023-03-02 16:06:05 BRT
Last validated checkpoint 2023-03-02 16:00:42 BRT
System Name AVAMAR.XXX.XXX
System ID 1234567890@00:1E:67:75:C8:AD
HFSAddr 10.123.123.123
HFSPort 27000
IP address 10.123.123.123
Number of nodes 3
Nodes Online 0
Nodes Offline 0
Nodes Read-only 3
Nodes Timed-out 0
admin@avamar:~/>:
avmaint nodelist | grep fs-percent-full | sort | tail -3
admin@avamar:~/>: avmaint nodelist | grep fs-percent-full | sort | tail -3
fs-percent-full="96.9"
fs-percent-full="96.9"
fs-percent-full="96.9"
admin@avamar:~/>:
Si el servidor Avamar es un nodo múltiple, el siguiente comando puede ayudar a identificar la alta capacidad del sistema operativo por nodo:
avmaint nodelist | egrep 'nodetag|fs-percent-full'
admin@avamar:~/>: avmaint nodelist | egrep 'nodetag|fs-percent-full'
nodetag="0.2"
fs-percent-full="96.7"
fs-percent-full="96.9"
fs-percent-full="96.9"
nodetag="0.1"
fs-percent-full="96.9"
fs-percent-full="96.4"
fs-percent-full="96.8"
nodetag="0.0"
fs-percent-full="96.3"
fs-percent-full="96.8"
fs-percent-full="96.7"
admin@avamar:~/>:Cause
La tasa de cambio diaria es demasiado alta para que la cuadrícula de Avamar se mantenga al día. Un gran cambio de datos dentro de un solo día puede causar un pico repentino en la capacidad del sistema operativo. El cambio significa una alta entrada de datos nuevos y una rápida eliminación de los datos antiguos. El cambio se debe ingresar en Avamar gradualmente cuando sea posible. Cuanto más lleno sea un sistema, mayor será el impacto de un incremento repentino en los datos modificados.
La capacidad.La herramienta sh es útil para rastrear la tasa de cambio en una cuadrícula.
Para obtener información sobre cómo utilizar la capacidad.sh script, revise el siguiente artículo.
AvamarEjemplo:
capacity.sh
DATE AVAMAR NEW #BU DDR NEW #BU SCANNED REMOVED MINS PASS AVAMAR NET CHG RATE
========== ============= ==== ============= ==== ============= ============= ==== ==== ============= ==========
2015-09-04 1770185 mb 367 36590255 mb 4414 427354917 mb -1155011 mb 179 36 615174 mb 8.98%
2015-09-05 1799386 mb 366 35834788 mb 4384 424229450 mb -967906 mb 158 36 831480 mb 8.87%
2015-09-06 1641614 mb 366 36339601 mb 4387 422918309 mb -715952 mb 95 36 925662 mb 8.98%
2015-09-07 1482274 mb 368 36021600 mb 4382 422096834 mb -1369565 mb 182 35 112708 mb 8.89%
2015-09-08 1476971 mb 376 35466632 mb 4379 418749502 mb -882663 mb 120 36 594307 mb 8.82%
2015-09-09 2338688 mb 377 36564862 mb 4408 426949173 mb -521711 mb 102 36 1816976 mb 9.11%
2015-09-10 1830728 mb 482 36776445 mb 4303 423650873 mb -369845 mb 80 36 1460882 mb 9.11%
2015-09-11 10323736 mb 478 33010286 mb 4416 435953105 mb -1016271 mb 159 34 9307465 mb 9.94%
2015-09-12 8773933 mb 473 32431241 mb 4399 442013401 mb -167120 mb 64 35 8606813 mb 9.32%
2015-09-13 8834627 mb 485 31265504 mb 4378 434459112 mb -186507 mb 60 35 8648119 mb 9.23%
2015-09-14 8605313 mb 479 31150950 mb 4391 434117515 mb -32753 mb 41 35 8572559 mb 9.16%
2015-09-15 10727441 mb 478 32164212 mb 4393 435520200 mb -58643 mb 53 36 10668797 mb 9.85%
2015-09-16 10133770 mb 477 31557436 mb 4396 432462001 mb -55780 mb 43 36 10077989 mb 9.64%
2015-09-17 9941271 mb 477 30824614 mb 4419 434292081 mb -68284 mb 53 35 9872986 mb 9.39%
2015-09-18 10147447 mb 416 24608011 mb 3237 319673822 mb -577890 mb 124 35 9569557 mb 10.87%
================================================================================================================
14 DAY AVG 5988492 mb 431 33373763 mb 4312 422296020 mb -543060 mb 101 35 5445432 mb 9.32%
30 DAY AVG 3622366 mb 403 36648167 mb 4353 427001356 mb -1326697 mb 150 34 2295669 mb 9.43%
60 DAY AVG 3047161 mb 392 34199043 mb 4323 417800256 mb -1489983 mb 159 34 1557178 mb 8.91%
Resolution
Verifique que la retención de punto de control esté configurada en los valores predeterminados.
avmaint config --ava | grep -i "cpmostrecent\|cphfschecked"
cpmostrecent="2"
cphfschecked="1"
Deshabilite el procesamiento asíncrono para que la capacidad del sistema operativo no siga creciendo durante el proceso de solución de problemas.
avmaint config --ava asynccrunching=false
admin@avamar:~/>: avmaint config --ava asynccrunching=false
<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<gsanconfig asynccrunching="true"/>
admin@avamar:~/>:
Compruebe el estado actual de la capacidad del sistema operativo:
avmaint nodelist | grep fs-percent-full | sort | tail -3
admin@avamar:~/>: avmaint nodelist | grep fs-percent-full | sort | tail -3
fs-percent-full="90.9"
fs-percent-full="91.0"
fs-percent-full="91.2"
admin@avamar:~/>:
El resultado de este comando determina las siguientes acciones:
En el escenario n.° 1 , la capacidad del sistema operativo está por encima del 89 %, pero por debajo del 96 %.
Los puntos de control aún se completan. La capacidad del sistema operativo disminuye cuando Avamar pasa por el siguiente ciclo de mantenimiento.Escenario n.° 2 : la capacidad del sistema operativo está por encima del 96 % pero por debajo del 98 %.
Confirme que la retención del punto de control esté configurada con los valores correctos, tal como se indica en la situación 1. Si los puntos de control tienen el conjunto de retención correcto, abra un caso con soporte.Escenario n.° 3: la capacidad del sistema operativo es superior al 98 %.
Abra un caso con soporte.Additional Information
Para obtener más información sobre los problemas de capacidad del sistema operativo Avamar, consulte: Avamar: Capacitación
y conceptos de administración de capacidadLas actividades de mantenimiento de Avamar requieren una cierta cantidad de espacio libre en el sistema operativo para ejecutarse como se muestra en el siguiente diagrama.
Configuración predeterminada determinada, si la capacidad del sistema operativo es
y conceptos de administración de capacidadLas actividades de mantenimiento de Avamar requieren una cierta cantidad de espacio libre en el sistema operativo para ejecutarse como se muestra en el siguiente diagrama.
Configuración predeterminada determinada, si la capacidad del sistema operativo es
- >89 % ==> la recolección de elementos no utilizados no podrá iniciarse
- >96 % ==> se ejecutan puntos de control
100% "---------------------" <-- 100% Data partition capacity
" CP cannot run >96% "
" "
" GC cannot run >89% "
89% "---------------------"
" Reserved for "
" checkpoint "
" overhead "
" "
65% "---------------------" <-- 100% User Capacity
" Commonality " Can be monitored
" factored data " from the Admin
" & RAIN parity " GUI.
" data "
" "
" "
" "
" "
" "
" "
" "
0% "---------------------"
Affected Products
AvamarProducts
Avamar, Avamar ServerArticle Properties
Article Number: 000040861
Article Type: Solution
Last Modified: 15 May 2025
Version: 28
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.