ECS: Il container è permanentemente inattivo sul nodo: Symptom Code: 2021

Riepilogo: Questo articolo della knowledgebase spiega il motivo per cui ECS ha segnalato che un container è permanentemente inattivo su un nodo.

Questo articolo si applica a Questo articolo non si applica a Questo articolo non è legato a un prodotto specifico. Non tutte le versioni del prodotto sono identificate in questo articolo.

Sintomi

Il sistema ha chiamato casa con il seguente avviso:
Clarify Id: APMxxxxxxxx
Site Name: UNKNOWN
Vendor: EMC
DeviceType: ElasticCloudStorageApp
Model: ElasticCloudStorage
SerialNumber: APMxxxxxxxx
WWN: APMxxxxxxxx
Platform: platform
OS: SLES
OS_VER: 12.4
EmbedLevel: 2
InternalMaxSize: 512800
Comment: Fabric
Ucode_Ver: 3.7.0.6-7700.ed29023b
ConnectType: ESRS
IP_Address: Not Available
IP_Name: hostname.domainname.net
ConnectNum: 169.254.1.1
Port: 22

SymptomCode: 2021
Category: Status
Severity: Critical
Status: Failed
Component: Node
ComponentID: xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxx
SubComponent: Service
SubComponentID: <docker container name>
CallHome: true
FirstTime: 2023-12-09T07:48:20.232Z
Description: Container <container> is permanently down on node <node>

Causa

Il container si è arrestato, sospeso o non avviato affatto per almeno 10 minuti.

Risoluzione

I container Docker (object-main, fabric-lifecycle, fabric-zookeeper, fabric-registry) si sono arrestati o messi in pausa o non si sono avviati affatto per almeno 10 minuti. Utilizzare la procedura seguente per determinare il container in errore:
  1. In base all'ID componente o all'ID nodo, determinare il nodo nel cluster ECS che ha registrato l'errore. Esempio: ID componente
4ca42022-46ed-475e-8ab7-6ef9141e5415
sudo /opt/emc/caspian/fabric/cli/bin/fcli lifecycle node.network --id 4ca42022-46ed-475e-8ab7-6ef9141e5415
{
  "network": {
    "hostname": "hostname.domainname.net",  << Hostname
    "private_ip": "169.254.1.3",       << NAN IP
    "mgmt_ip": "10.2.3.4",     << Management IP 
    "public_ip": "10.241.207.59",
    "data_ip": "10.241.207.73",
    "replication_ip": "10.241.207.59",
    "public_interface_name": "public",
    "private_interface_name": "private.4",
    "mgmt_interface_name": "public",
    "data_interface_name": "public:data",
    "replication_interface_name": "public"
  },
  "status": "OK",
  "etag": 50
}
  1.  Accedere tramite SSH al nodo di destinazione utilizzando l'IP di gestione, l'IP privato o il nome host.
 
  1. Verificare che il server Docker sia operativo con i parametri appropriati
# ps -ef | grep docker
root      50062      1  0 Jun02 ?        00:02:11 /usr/bin/docker daemon -H fd:// --insecure-registry=0.0.0.0/0 --log-level=warn
  1. A questo punto, è necessario convalidare quale container (colonna NOMI) è stato arrestato o non avviato affatto per qualche motivo (vedere la colonna STATUS):
# sudo docker ps -a
CONTAINER ID        IMAGE               COMMAND                  CREATED                STATUS              PORTS               NAMES
7bf16df0ef15        464b97154c24        "/opt/vipr/boot/boot."   3 days ago          Up 3 days                                    object-main
0ef5cc422543        24d9d6008893        "./boot.sh lifecycle"    3 days ago          Up 3 days                                    fabric-lifecycle
87d6c77d98ca        32cce433c3dc        "./boot.sh 3 1=169.25"   3 days ago          Up 3 days                                    fabric-zookeeper
  1. Verificare che il servizio fabric sia in esecuzione. L'agent fabric tenta di riattivare automaticamente il container problematico
# sudo service fabric-agent status
fabric-agent.service - fabric agent
   Loaded: loaded (/usr/lib/systemd/system/fabric-agent.service; enabled)
   Active: active (running) since Thu 2016-06-02 17:56:39 UTC; 3 days ago
  Process: 50643 ExecStartPre=/bin/rm -f /var/run/fabric-agent.pid (code=exited, status=0/SUCCESS)
 Main PID: 50645 (java)
   CGroup: /system.slice/fabric-agent.service
  1. Visualizzazione dello stato del container arrestato/guasto 
# sudo docker inspect fabric-zookeeper | grep -A12 State
    "State": {
        "Status": "running",
        "Running": true,
        "Paused": false,
        "Restarting": false,
        "OOMKilled": false,
        "Dead": false,
        "Pid": 80462,
        "ExitCode": 0,
        "Error": "",
        "StartedAt": "2016-06-06T17:29:12.968133861Z",
        "FinishedAt": "2016-06-06T17:29:12.882812946Z"
    },
 
Se non siamo ancora certi dell'esistenza o meno di un problema, consultare il supporto tecnico ECS per ulteriore assistenza.

Prodotti interessati

ECS Appliance Software without Encryption

Prodotti

ECS Appliance, ECS Appliance Software with Encryption, ECS Appliance Software without Encryption
Proprietà dell'articolo
Numero articolo: 000064491
Tipo di articolo: Solution
Ultima modifica: 17 dic 2025
Versione:  6
Trova risposta alle tue domande dagli altri utenti Dell
Support Services
Verifica che il dispositivo sia coperto dai Servizi di supporto.