Avamar: Checkpoint mislukt met resultaat-MSG_ERR_DDR_ERROR als gevolg van capaciteitsproblemen van Data Domain

Summary: Data Domain (DD) ruimtegebruik in dataverzameling heeft de drempel van 100% overschreden, waardoor Avamar-controlestations mislukken met MSG_ERR_DDR_ERROR.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Zowel geplande als handmatige controlestations mislukken met MSG_ERR_DDR_ERROR.

Bijvoorbeeld:

status.dpn
Mon Aug 19 13:33:53 WEST 2019  [AV-XXX] Mon Aug 19 12:33:53 2019 UTC (Initialized Wed Feb 11 12:42:51 2015 UTC)
Node   IP Address     Version   State   Runlevel  Srvr+Root+User Dis Suspend Load UsedMB Errlen  %Full   Percent Full and Stripe Status by Disk
0.0     10.xxx.x.xx  19.1.0-38  ONLINE fullaccess mhpu+0hpu+0hpu   1 false   0.3 0 31802 52675327  11.8%  12%(onl:4148) 11%(onl:4133) 11%(onl:4135) 11%(onl:4140)  11%(onl:4138) 11%(onl:4147)
Srvr+Root+User Modes = migrate + hfswriteable + persistwriteable + useraccntwriteable

System ID: XXXXXXXX@00:1E:67:87:C4:6B

All reported states=(ONLINE), runlevels=(fullaccess), modes=(mhpu+0hpu+0hpu)
System-Status: ok
Access-Status: full

Checkpoint failed with result MSG_ERR_DDR_ERROR : cp.20190819054530 started Mon Aug 19 06:45:31 2019 ended Mon Aug 19 06:58:24 2019, completed 24840 of 24841 stripes
Last GC: finished Mon Aug 19 05:21:35 2019 after 20m 58s >> recovered 71.89 MB (MSG_ERR_DDR_ERROR)
Last hfscheck failed with result MSG_ERR_DDR_ERROR : started Mon Aug 19 05:34:23
Opmerking: Zoals in het bovenstaande voorbeeld te zien is, is dit mogelijk niet beperkt tot alleen controleposten.
 
 

Het Data Domain logboek (/usr/local/avamar/var/ddrmaintlogs/ddrmaint.log) meldt een "I/O error":

grep -i Error /usr/local/avamar/var/ddrmaintlogs/ddrmaint.log|grep -v -i "Error not set"
Aug 19 05:15:50 av-XXX ddrmaint.bin[49665]: Error: <4710>Datadomain garbage collect operation failed.
Aug 19 05:34:18 av-XXX ddrmaint.bin[52434]: Warning: Calling DDR_CREATE_SNAPSHOT returned result code:5009 message:I/O error
Aug 19 05:34:18 av-XXX ddrmaint.bin[52434]: Error: cp-create::execute_create_checkpoint - Failed to create checkpoint for avamar-XXXXXXX to snapshot cp.20190819042140 on ddXXX, DDR result code: 5009, desc: I/O error
Aug 19 05:34:18 av-XXX ddrmaint.bin[52434]: Error: <4760>Datadomain checkpoint create operation failed.

Cause

De Data Domain (DD)-ruimte heeft de capaciteit bereikt.

Dit kan worden geverifieerd door het volgende te doen:

1. Maak verbinding met het Data Domain. Gebruik Avamar: Toegang tot een Data Domain-systeem als referentie, indien nodig.

2. Controleer op waarschuwingen:

alerts show current
Id      Post Time                  Severity   Class        Object          Message
-----   ------------------------   --------   ----------   -------------   ----------------------------------------------------------------------------
p0-87   Fri Aug 16 21:55:33 2019   CRITICAL   Filesystem   FilesysType=2   EVT-SPACE-00004: Space usage in Data Collection has exceeded 100% threshold.
-----   ------------------------   --------   ----------   -------------   ----------------------------------------------------------------------------
There is 1 active alert.
 

3. Start de "df" bevelen:

df
Active Tier:
Resource           Size GiB   Used GiB   Avail GiB   Use%   Cleanable GiB*
----------------   --------   --------   ---------   ----   --------------
/data: pre-comp           -       15.1           -      -                -
/data: post-comp    30731.1    30608.8       122.3   100%             13.1
/ddvar                 49.1        8.7        37.9    19%                -
/ddvar/core           158.3        0.1       150.2     0%                -
----------------   --------   --------   ---------   ----   --------------
 * Estimated based on last cleaning of 2019/07/15 06:04:40.

Cloud Tier
Resource           Size GiB   Used GiB   Avail GiB   Use%   Cleanable GiB
----------------   --------   --------   ---------   ----   -------------
/data: pre-comp           -       19.0           -      -               -
/data: post-comp   33487.7*       20.4     33467.4     0%             0.0
----------------   --------   --------   ---------   ----   -------------
* Post-comp size is based on CLOUDTIER-CAPACITY license and might not be same as the cloud storage.

Total:
Resource           Size GiB   Used GiB   Avail GiB   Use%   Cleanable GiB
----------------   --------   --------   ---------   ----   -------------
/data: pre-comp           -       34.1           -      -               -
/data: post-comp    33829.9       36.4     33793.4     0%             0.0
/ddvar                 49.1        8.7        37.9    19%               -
/ddvar/core           158.3        0.1       150.2     0%               -
----------------   --------   --------   ---------   ----   -------------

Resolution

1. Op Data Domain:

een. Controleer de opschoonstatus van het bestandssysteem:

filesys clean status 
 

Voorbeeld van uitvoer:

Opschonen wordt niet uitgevoerd:

Cleaning finished at 2019/08/19 21:37:46
 

Opschonen wordt uitgevoerd:

Cleaning started at 2019/08/19 06:00:02: phase 3 of 6 (pre-enumeration)
  1.6% complete,     0 GiB free; time: phase  1:26:05, total  1:48:11
 

b. Als de opschoning wordt uitgevoerd, wacht u tot deze is voltooid en controleert u vervolgens de capaciteit met de opdracht df.

c. Als het opschonen niet wordt uitgevoerd, controleer dan het opschoonschema van het bestandssysteem:

filesys clean show schedule
 

Voorbeelduitvoer:

Filesystem cleaning is scheduled to run "Tue" at "0700".
 

d. Start indien nodig een handmatig opschonen van het bestandssysteem en controleer het tot voltooiing met behulp van de "fileysys clean watch" opdracht zoals aangegeven in de onderstaande uitvoer.

filesys clean start
Cleaning started.  Use 'filesys clean watch' to monitor progress.
 
Opmerking: Als het probleem zich blijft voordoen na het opschonen van het bestandssysteem, neem dan contact op met een Data Domain bestandssysteemengineer om u te helpen.
 
 

2. On Avamar:

een. Zodra de capaciteitsproblemen op Data Domain zijn opgelost, voert u een handmatige controle uit:

mccli checkpoint create --override_maintenance_scheduler
Opmerking: De mccli-opdracht duurt langer, maar bevat een MCS-back-up (Management Console Server) (ook wel flush genoemd).
 

b. Controleer tot voltooiing en controleer of dit is gelukt.

c. Controleer het raster tot en met het volgende onderhoudsvenster om te controleren of alle Avamar-onderhoudstaken (checkpoint, checkpointvalidatie, (hfscheck) en de garbage collection is voltooid.

Additional Information

Als het probleem zich voordoet na het opschonen van het bestandssysteem, moet de engineer van het Data Domain bestandssysteem worden ingeschakeld.

Affected Products

Avamar

Products

Avamar, Avamar Server
Article Properties
Article Number: 000046232
Article Type: Solution
Last Modified: 23 Jul 2025
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.