Data Domain cloud tier con ECS è disconnesso a causa di ECS che riscontra un errore interno o che risulta pieno

Summary: Ci sono molte ragioni per cui il file system di Data Domain indica che il profilo del cloud tier è stato disconnesso, causando l'interruzione dei processi data-movement, recall o di pulizia del cloud per colpa dell'unità cloud in stato UNAVAILABLE. Uno dei motivi è l'errore del server interno 500 da ECS ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms



Ci sono molte ragioni per cui il file system di Data Domain indica che il profilo del cloud tier è stato disconnesso, causando l'interruzione dei processi data-movement, recall o di pulizia del cloud per colpa dell'unità cloud in stato UNAVAILABLE.

Uno dei motivi per cui l'unità del cloud tier viene disconnessa è dovuto a un errore interno "HTTP operation returned code:500" da ECS.

In tal caso, verrà visualizzato un messaggio di avviso simile:
Time: Sun Mar 1 00:08:44 2020 Alert Id: m0-3761 Event Id: EVT-CLOUD-00001 Event Message: Unable to access provider for cloud unit XXXX-XXXX-XXX. Object: CloudUnit=XXXX-XXXX-XXXX Additional Information: Cause=We encountered an internal error. Please try again. 
Due to this error , the cloud tier cleaning process may get terminated if it was in progress :
Cloud Cleaning Status --------------------- Cloud tier cleaning started on cloud unit "XXXX-XXXX-XXXX" at 2020/02/12 15:56:11 and was aborted at 2020/02/14 03:12:56. Cloud tier cleaning was aborted because cloud is unavailable Background deletion completed. 

From ddfs.info log file we may see similar error messages for the reason why the cloud tier unit got disconnected : 
02/02 10:35:58.067 (tid 0xbf47f70): ERROR: CAL cl_request_convert_httpcode_to_err:1539 - HTTP operation returned code:500, request error:We encountered an internal error. Please try again. [5009] .... 02/02 10:35:58.067 (tid 0x7f6ab4714fd0): INFO: CAL cal_cloudunit_set_unavail:1339 - Marking cloud unit:XXXX-XXXX-XXXX-XXXX as UNAVAILABLE .... 02/02 10:35:58.067 (tid 0x7f77e22e2370): Fmig: fmig2_process_cal_event: XXXX-XXXX-XXXX-XXXX (path=cloud1/cp1): receiving DDR_EVENT_CAL_UNIT_UNAVAIL event .... 02/02 10:35:59.229 (tid 0x7f6ab4714fd0): INFO: Event posted: m0-1361 (21000551:553649489): EVT-CLOUD-00001: Unable to access provider for cloud unit XXXX-XXXX-XXXX-XXXX.EVT-OBJ::CloudUnit=XXXX-XXXX-XXXX-XXXX EVT-INFO::Cause=We encountered an internal error. Please try again. ... 02/02 10:35:58.067 (tid 0x7f6ab4714fd0): INFO: CAL cal_cloudunit_set_unavail:1339 - Marking cloud unit:XXXX-XXXX-XXXX as UNAVAILABLE 

The 500 Internal Server Error is a general HTTP status code that means something has gone wrong on the server.
The 5xx errors are the status codes returned by the server when the server encounters an unexpected condition which prevented it from fulfilling the request from a client "the data domain system in our case " .
This error response is a generic error response that needs further investigation to get the reason for it . 

Dal supporto automatico più recente, è possibile seguire lo stato delle richieste cloud controllando le statistiche di errore cloud per il bucket di dati dell'unità cloud:

Cloud error stats for bucket:<name of the bucket>-d0 Number of Retries : 9180 ... Number of http 400 errors : 0 Number of http 403 errors : 0 ... Number of http 416 errors : 0 Number of http 429 errors : 0 Number of http 500 errors : 10195 ----------->lots of 500 errors Number of http 503 errors : 0 ...

Cause

Motivo 1:
Uno dei motivi principali per cui DD riceve questo messaggio di errore è che ECS è completamente pieno, perciò rifiuta le richieste in ingresso dall'unità Data Domain. Per risolvere questo problema, liberare spazio da ECS per ripristinare la connessione DD con il cloud ECS. 

Motivo 2: 
ECS è occupato, quindi non è in grado di soddisfare tutte le richieste in entrata.

Vi sono anche altri motivi che potrebbero causare questo errore 

Resolution

Soluzione:
Se il cloud ECS è pieno, Data Domain continuerà a ricevere messaggi di errore di disconnessione fino a quando il profilo del cloud tier non ottiene spazio libero affinché il sistema Data Domain possa ripristinare la comunicazione. 

Soluzione: 
Se il cloud ECS è occupato, si consiglia di non eseguire i processi garbage collection, data-movement o recall nello stesso momento, se si ricevono errori del server interno 500; provare a pianificarne l'esecuzione in momenti diversi per fornire al cloud tier ECS lo spazio per gestire tutte le richieste in entrata. Chiedere assistenza al supporto ECS individuare altri problemi 


Additional Information

Se il problema non è stato risolto, aprire una nuova richiesta di assistenza con il supporto di ECS e Data Domain per analizzare insieme il problema. 
Raccogliere e caricare un nuovo pacchetto di supporto quando si apre una nuova richiesta di assistenza Data Domain 

Affected Products

Data Domain

Products

Data Domain, Data Domain Deduplication Storage Systems
Article Properties
Article Number: 000081881
Article Type: Solution
Last Modified: 11 Dec 2023
Version:  4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.