ECS: Der Container ist auf dem Node dauerhaft ausgefallen: Symptom Code: 2021

Podsumowanie: In diesem Wissensdatenbank-Artikel wird erläutert, warum ECS gemeldet hat, dass ein Container dauerhaft auf einem Node ausgefallen ist.

Ten artykuł dotyczy Ten artykuł nie dotyczy Ten artykuł nie jest powiązany z żadnym konkretnym produktem. Nie wszystkie wersje produktu zostały zidentyfikowane w tym artykule.

Objawy

Das System hat Dial-Home mit der folgenden Warnmeldung ausgeführt:
Clarify Id: APMxxxxxxxx
Site Name: UNKNOWN
Vendor: EMC
DeviceType: ElasticCloudStorageApp
Model: ElasticCloudStorage
SerialNumber: APMxxxxxxxx
WWN: APMxxxxxxxx
Platform: platform
OS: SLES
OS_VER: 12.4
EmbedLevel: 2
InternalMaxSize: 512800
Comment: Fabric
Ucode_Ver: 3.7.0.6-7700.ed29023b
ConnectType: ESRS
IP_Address: Not Available
IP_Name: hostname.domainname.net
ConnectNum: 169.254.1.1
Port: 22

SymptomCode: 2021
Category: Status
Severity: Critical
Status: Failed
Component: Node
ComponentID: xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxx
SubComponent: Service
SubComponentID: <docker container name>
CallHome: true
FirstTime: 2023-12-09T07:48:20.232Z
Description: Container <container> is permanently down on node <node>

Przyczyna

Der Container wurde mindestens 10 Minuten lang angehalten, angehalten oder überhaupt nicht gestartet.

Rozwiązanie

Docker-Container (object-main, fabric-lifecycle, fabric-zookeeper, fabric-registry) wurden angehalten oder angehalten oder für mindestens 10 Minuten überhaupt nicht gestartet. Verwenden Sie das folgende Verfahren, um den fehlerhaften Container zu ermitteln:
  1. Bestimmen Sie anhand der Komponenten-ID oder Node-ID den Node im ECS-Cluster, der den Fehler registriert hat. Beispiel: Komponenten-ID
4ca42022-46ed-475e-8ab7-6ef9141e5415
sudo /opt/emc/caspian/fabric/cli/bin/fcli lifecycle node.network --id 4ca42022-46ed-475e-8ab7-6ef9141e5415
{
  "network": {
    "hostname": "hostname.domainname.net",  << Hostname
    "private_ip": "169.254.1.3",       << NAN IP
    "mgmt_ip": "10.2.3.4",     << Management IP 
    "public_ip": "10.241.207.59",
    "data_ip": "10.241.207.73",
    "replication_ip": "10.241.207.59",
    "public_interface_name": "public",
    "private_interface_name": "private.4",
    "mgmt_interface_name": "public",
    "data_interface_name": "public:data",
    "replication_interface_name": "public"
  },
  "status": "OK",
  "etag": 50
}
  1.  Stellen Sie eine SSH-Verbindung zum Ziel-Node über die Management-IP, die private IP-Adresse oder den Hostnamen her.
 
  1. Überprüfen Sie, ob der Docker-Server mit den richtigen Parametern betriebsbereit ist
# ps -ef | grep docker
root      50062      1  0 Jun02 ?        00:02:11 /usr/bin/docker daemon -H fd:// --insecure-registry=0.0.0.0/0 --log-level=warn
  1. Als nächstes müssen wir überprüfen, welcher Container (NAMES-Spalte) beendet wurde oder aus irgendeinem Grund überhaupt nicht gestartet wurde (siehe Spalte STATUS):
# sudo docker ps -a
CONTAINER ID        IMAGE               COMMAND                  CREATED                STATUS              PORTS               NAMES
7bf16df0ef15        464b97154c24        "/opt/vipr/boot/boot."   3 days ago          Up 3 days                                    object-main
0ef5cc422543        24d9d6008893        "./boot.sh lifecycle"    3 days ago          Up 3 days                                    fabric-lifecycle
87d6c77d98ca        32cce433c3dc        "./boot.sh 3 1=169.25"   3 days ago          Up 3 days                                    fabric-zookeeper
  1. Überprüfen Sie, ob der Fabric-Service ausgeführt wird. Fabric-Agent versucht, den problematischen Container automatisch wiederzubeleben
# sudo service fabric-agent status
fabric-agent.service - fabric agent
   Loaded: loaded (/usr/lib/systemd/system/fabric-agent.service; enabled)
   Active: active (running) since Thu 2016-06-02 17:56:39 UTC; 3 days ago
  Process: 50643 ExecStartPre=/bin/rm -f /var/run/fabric-agent.pid (code=exited, status=0/SUCCESS)
 Main PID: 50645 (java)
   CGroup: /system.slice/fabric-agent.service
  1. Anzeigen des Status gestoppter/fehlgeschlagener Container 
# sudo docker inspect fabric-zookeeper | grep -A12 State
    "State": {
        "Status": "running",
        "Running": true,
        "Paused": false,
        "Restarting": false,
        "OOMKilled": false,
        "Dead": false,
        "Pid": 80462,
        "ExitCode": 0,
        "Error": "",
        "StartedAt": "2016-06-06T17:29:12.968133861Z",
        "FinishedAt": "2016-06-06T17:29:12.882812946Z"
    },
 
Wenn Sie sich immer noch nicht sicher sind, ob ein Problem vorliegt oder nicht, wenden Sie sich an den technischen Support von ECS, um weitere Unterstützung zu erhalten.

Produkty, których dotyczy problem

ECS Appliance Software without Encryption

Produkty

ECS Appliance, ECS Appliance Software with Encryption, ECS Appliance Software without Encryption
Właściwości artykułu
Numer artykułu: 000064491
Typ artykułu: Solution
Ostatnia modyfikacja: 17 gru 2025
Wersja:  6
Znajdź odpowiedzi na swoje pytania u innych użytkowników produktów Dell
Usługi pomocy technicznej
Sprawdź, czy Twoje urządzenie jest objęte usługą pomocy technicznej.