ECS: Der Container ist auf dem Node dauerhaft ausgefallen: Symptom Code: 2021

Resumo: In diesem Wissensdatenbank-Artikel wird erläutert, warum ECS gemeldet hat, dass ein Container dauerhaft auf einem Node ausgefallen ist.

Este artigo aplica-se a Este artigo não se aplica a Este artigo não está vinculado a nenhum produto específico. Nem todas as versões do produto estão identificadas neste artigo.

Sintomas

Das System hat Dial-Home mit der folgenden Warnmeldung ausgeführt:
Clarify Id: APMxxxxxxxx
Site Name: UNKNOWN
Vendor: EMC
DeviceType: ElasticCloudStorageApp
Model: ElasticCloudStorage
SerialNumber: APMxxxxxxxx
WWN: APMxxxxxxxx
Platform: platform
OS: SLES
OS_VER: 12.4
EmbedLevel: 2
InternalMaxSize: 512800
Comment: Fabric
Ucode_Ver: 3.7.0.6-7700.ed29023b
ConnectType: ESRS
IP_Address: Not Available
IP_Name: hostname.domainname.net
ConnectNum: 169.254.1.1
Port: 22

SymptomCode: 2021
Category: Status
Severity: Critical
Status: Failed
Component: Node
ComponentID: xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxx
SubComponent: Service
SubComponentID: <docker container name>
CallHome: true
FirstTime: 2023-12-09T07:48:20.232Z
Description: Container <container> is permanently down on node <node>

Causa

Der Container wurde mindestens 10 Minuten lang angehalten, angehalten oder überhaupt nicht gestartet.

Resolução

Docker-Container (object-main, fabric-lifecycle, fabric-zookeeper, fabric-registry) wurden angehalten oder angehalten oder für mindestens 10 Minuten überhaupt nicht gestartet. Verwenden Sie das folgende Verfahren, um den fehlerhaften Container zu ermitteln:
  1. Bestimmen Sie anhand der Komponenten-ID oder Node-ID den Node im ECS-Cluster, der den Fehler registriert hat. Beispiel: Komponenten-ID
4ca42022-46ed-475e-8ab7-6ef9141e5415
sudo /opt/emc/caspian/fabric/cli/bin/fcli lifecycle node.network --id 4ca42022-46ed-475e-8ab7-6ef9141e5415
{
  "network": {
    "hostname": "hostname.domainname.net",  << Hostname
    "private_ip": "169.254.1.3",       << NAN IP
    "mgmt_ip": "10.2.3.4",     << Management IP 
    "public_ip": "10.241.207.59",
    "data_ip": "10.241.207.73",
    "replication_ip": "10.241.207.59",
    "public_interface_name": "public",
    "private_interface_name": "private.4",
    "mgmt_interface_name": "public",
    "data_interface_name": "public:data",
    "replication_interface_name": "public"
  },
  "status": "OK",
  "etag": 50
}
  1.  Stellen Sie eine SSH-Verbindung zum Ziel-Node über die Management-IP, die private IP-Adresse oder den Hostnamen her.
 
  1. Überprüfen Sie, ob der Docker-Server mit den richtigen Parametern betriebsbereit ist
# ps -ef | grep docker
root      50062      1  0 Jun02 ?        00:02:11 /usr/bin/docker daemon -H fd:// --insecure-registry=0.0.0.0/0 --log-level=warn
  1. Als nächstes müssen wir überprüfen, welcher Container (NAMES-Spalte) beendet wurde oder aus irgendeinem Grund überhaupt nicht gestartet wurde (siehe Spalte STATUS):
# sudo docker ps -a
CONTAINER ID        IMAGE               COMMAND                  CREATED                STATUS              PORTS               NAMES
7bf16df0ef15        464b97154c24        "/opt/vipr/boot/boot."   3 days ago          Up 3 days                                    object-main
0ef5cc422543        24d9d6008893        "./boot.sh lifecycle"    3 days ago          Up 3 days                                    fabric-lifecycle
87d6c77d98ca        32cce433c3dc        "./boot.sh 3 1=169.25"   3 days ago          Up 3 days                                    fabric-zookeeper
  1. Überprüfen Sie, ob der Fabric-Service ausgeführt wird. Fabric-Agent versucht, den problematischen Container automatisch wiederzubeleben
# sudo service fabric-agent status
fabric-agent.service - fabric agent
   Loaded: loaded (/usr/lib/systemd/system/fabric-agent.service; enabled)
   Active: active (running) since Thu 2016-06-02 17:56:39 UTC; 3 days ago
  Process: 50643 ExecStartPre=/bin/rm -f /var/run/fabric-agent.pid (code=exited, status=0/SUCCESS)
 Main PID: 50645 (java)
   CGroup: /system.slice/fabric-agent.service
  1. Anzeigen des Status gestoppter/fehlgeschlagener Container 
# sudo docker inspect fabric-zookeeper | grep -A12 State
    "State": {
        "Status": "running",
        "Running": true,
        "Paused": false,
        "Restarting": false,
        "OOMKilled": false,
        "Dead": false,
        "Pid": 80462,
        "ExitCode": 0,
        "Error": "",
        "StartedAt": "2016-06-06T17:29:12.968133861Z",
        "FinishedAt": "2016-06-06T17:29:12.882812946Z"
    },
 
Wenn Sie sich immer noch nicht sicher sind, ob ein Problem vorliegt oder nicht, wenden Sie sich an den technischen Support von ECS, um weitere Unterstützung zu erhalten.

Produtos afetados

ECS Appliance Software without Encryption

Produtos

ECS Appliance, ECS Appliance Software with Encryption, ECS Appliance Software without Encryption
Propriedades do artigo
Número do artigo: 000064491
Tipo de artigo: Solution
Último modificado: 17 dez. 2025
Versão:  6
Encontre as respostas de outros usuários da Dell para suas perguntas.
Serviços de suporte
Verifique se o dispositivo está coberto pelos serviços de suporte.