ECS: Der Container ist auf dem Node dauerhaft ausgefallen: Symptom Code: 2021

Summary: In diesem Wissensdatenbank-Artikel wird erläutert, warum ECS gemeldet hat, dass ein Container dauerhaft auf einem Node ausgefallen ist.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Das System hat Dial-Home mit der folgenden Warnmeldung ausgeführt:
Clarify Id: APMxxxxxxxx
Site Name: UNKNOWN
Vendor: EMC
DeviceType: ElasticCloudStorageApp
Model: ElasticCloudStorage
SerialNumber: APMxxxxxxxx
WWN: APMxxxxxxxx
Platform: platform
OS: SLES
OS_VER: 12.4
EmbedLevel: 2
InternalMaxSize: 512800
Comment: Fabric
Ucode_Ver: 3.7.0.6-7700.ed29023b
ConnectType: ESRS
IP_Address: Not Available
IP_Name: hostname.domainname.net
ConnectNum: 169.254.1.1
Port: 22

SymptomCode: 2021
Category: Status
Severity: Critical
Status: Failed
Component: Node
ComponentID: xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxx
SubComponent: Service
SubComponentID: <docker container name>
CallHome: true
FirstTime: 2023-12-09T07:48:20.232Z
Description: Container <container> is permanently down on node <node>

Cause

Der Container wurde mindestens 10 Minuten lang angehalten, angehalten oder überhaupt nicht gestartet.

Resolution

Docker-Container (object-main, fabric-lifecycle, fabric-zookeeper, fabric-registry) wurden angehalten oder angehalten oder für mindestens 10 Minuten überhaupt nicht gestartet. Verwenden Sie das folgende Verfahren, um den fehlerhaften Container zu ermitteln:
  1. Bestimmen Sie anhand der Komponenten-ID oder Node-ID den Node im ECS-Cluster, der den Fehler registriert hat. Beispiel: Komponenten-ID
4ca42022-46ed-475e-8ab7-6ef9141e5415
sudo /opt/emc/caspian/fabric/cli/bin/fcli lifecycle node.network --id 4ca42022-46ed-475e-8ab7-6ef9141e5415
{
  "network": {
    "hostname": "hostname.domainname.net",  << Hostname
    "private_ip": "169.254.1.3",       << NAN IP
    "mgmt_ip": "10.2.3.4",     << Management IP 
    "public_ip": "10.241.207.59",
    "data_ip": "10.241.207.73",
    "replication_ip": "10.241.207.59",
    "public_interface_name": "public",
    "private_interface_name": "private.4",
    "mgmt_interface_name": "public",
    "data_interface_name": "public:data",
    "replication_interface_name": "public"
  },
  "status": "OK",
  "etag": 50
}
  1.  Stellen Sie eine SSH-Verbindung zum Ziel-Node über die Management-IP, die private IP-Adresse oder den Hostnamen her.
 
  1. Überprüfen Sie, ob der Docker-Server mit den richtigen Parametern betriebsbereit ist
# ps -ef | grep docker
root      50062      1  0 Jun02 ?        00:02:11 /usr/bin/docker daemon -H fd:// --insecure-registry=0.0.0.0/0 --log-level=warn
  1. Als nächstes müssen wir überprüfen, welcher Container (NAMES-Spalte) beendet wurde oder aus irgendeinem Grund überhaupt nicht gestartet wurde (siehe Spalte STATUS):
# sudo docker ps -a
CONTAINER ID        IMAGE               COMMAND                  CREATED                STATUS              PORTS               NAMES
7bf16df0ef15        464b97154c24        "/opt/vipr/boot/boot."   3 days ago          Up 3 days                                    object-main
0ef5cc422543        24d9d6008893        "./boot.sh lifecycle"    3 days ago          Up 3 days                                    fabric-lifecycle
87d6c77d98ca        32cce433c3dc        "./boot.sh 3 1=169.25"   3 days ago          Up 3 days                                    fabric-zookeeper
  1. Überprüfen Sie, ob der Fabric-Service ausgeführt wird. Fabric-Agent versucht, den problematischen Container automatisch wiederzubeleben
# sudo service fabric-agent status
fabric-agent.service - fabric agent
   Loaded: loaded (/usr/lib/systemd/system/fabric-agent.service; enabled)
   Active: active (running) since Thu 2016-06-02 17:56:39 UTC; 3 days ago
  Process: 50643 ExecStartPre=/bin/rm -f /var/run/fabric-agent.pid (code=exited, status=0/SUCCESS)
 Main PID: 50645 (java)
   CGroup: /system.slice/fabric-agent.service
  1. Anzeigen des Status gestoppter/fehlgeschlagener Container 
# sudo docker inspect fabric-zookeeper | grep -A12 State
    "State": {
        "Status": "running",
        "Running": true,
        "Paused": false,
        "Restarting": false,
        "OOMKilled": false,
        "Dead": false,
        "Pid": 80462,
        "ExitCode": 0,
        "Error": "",
        "StartedAt": "2016-06-06T17:29:12.968133861Z",
        "FinishedAt": "2016-06-06T17:29:12.882812946Z"
    },
 
Wenn Sie sich immer noch nicht sicher sind, ob ein Problem vorliegt oder nicht, wenden Sie sich an den technischen Support von ECS, um weitere Unterstützung zu erhalten.

Affected Products

ECS Appliance Software without Encryption

Products

ECS Appliance, ECS Appliance Software with Encryption, ECS Appliance Software without Encryption
Article Properties
Article Number: 000064491
Article Type: Solution
Last Modified: 17 Dec 2025
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.