ECS: Der Container ist auf dem Node dauerhaft ausgefallen: Symptom Code: 2021

Zusammenfassung: In diesem Wissensdatenbank-Artikel wird erläutert, warum ECS gemeldet hat, dass ein Container dauerhaft auf einem Node ausgefallen ist.

Dieser Artikel gilt für Dieser Artikel gilt nicht für Dieser Artikel ist nicht an ein bestimmtes Produkt gebunden. In diesem Artikel werden nicht alle Produktversionen aufgeführt.

Symptome

Das System hat Dial-Home mit der folgenden Warnmeldung ausgeführt:
Clarify Id: APMxxxxxxxx
Site Name: UNKNOWN
Vendor: EMC
DeviceType: ElasticCloudStorageApp
Model: ElasticCloudStorage
SerialNumber: APMxxxxxxxx
WWN: APMxxxxxxxx
Platform: platform
OS: SLES
OS_VER: 12.4
EmbedLevel: 2
InternalMaxSize: 512800
Comment: Fabric
Ucode_Ver: 3.7.0.6-7700.ed29023b
ConnectType: ESRS
IP_Address: Not Available
IP_Name: hostname.domainname.net
ConnectNum: 169.254.1.1
Port: 22

SymptomCode: 2021
Category: Status
Severity: Critical
Status: Failed
Component: Node
ComponentID: xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxx
SubComponent: Service
SubComponentID: <docker container name>
CallHome: true
FirstTime: 2023-12-09T07:48:20.232Z
Description: Container <container> is permanently down on node <node>

Ursache

Der Container wurde mindestens 10 Minuten lang angehalten, angehalten oder überhaupt nicht gestartet.

Lösung

Docker-Container (object-main, fabric-lifecycle, fabric-zookeeper, fabric-registry) wurden angehalten oder angehalten oder für mindestens 10 Minuten überhaupt nicht gestartet. Verwenden Sie das folgende Verfahren, um den fehlerhaften Container zu ermitteln:
  1. Bestimmen Sie anhand der Komponenten-ID oder Node-ID den Node im ECS-Cluster, der den Fehler registriert hat. Beispiel: Komponenten-ID
4ca42022-46ed-475e-8ab7-6ef9141e5415
sudo /opt/emc/caspian/fabric/cli/bin/fcli lifecycle node.network --id 4ca42022-46ed-475e-8ab7-6ef9141e5415
{
  "network": {
    "hostname": "hostname.domainname.net",  << Hostname
    "private_ip": "169.254.1.3",       << NAN IP
    "mgmt_ip": "10.2.3.4",     << Management IP 
    "public_ip": "10.241.207.59",
    "data_ip": "10.241.207.73",
    "replication_ip": "10.241.207.59",
    "public_interface_name": "public",
    "private_interface_name": "private.4",
    "mgmt_interface_name": "public",
    "data_interface_name": "public:data",
    "replication_interface_name": "public"
  },
  "status": "OK",
  "etag": 50
}
  1.  Stellen Sie eine SSH-Verbindung zum Ziel-Node über die Management-IP, die private IP-Adresse oder den Hostnamen her.
 
  1. Überprüfen Sie, ob der Docker-Server mit den richtigen Parametern betriebsbereit ist
# ps -ef | grep docker
root      50062      1  0 Jun02 ?        00:02:11 /usr/bin/docker daemon -H fd:// --insecure-registry=0.0.0.0/0 --log-level=warn
  1. Als nächstes müssen wir überprüfen, welcher Container (NAMES-Spalte) beendet wurde oder aus irgendeinem Grund überhaupt nicht gestartet wurde (siehe Spalte STATUS):
# sudo docker ps -a
CONTAINER ID        IMAGE               COMMAND                  CREATED                STATUS              PORTS               NAMES
7bf16df0ef15        464b97154c24        "/opt/vipr/boot/boot."   3 days ago          Up 3 days                                    object-main
0ef5cc422543        24d9d6008893        "./boot.sh lifecycle"    3 days ago          Up 3 days                                    fabric-lifecycle
87d6c77d98ca        32cce433c3dc        "./boot.sh 3 1=169.25"   3 days ago          Up 3 days                                    fabric-zookeeper
  1. Überprüfen Sie, ob der Fabric-Service ausgeführt wird. Fabric-Agent versucht, den problematischen Container automatisch wiederzubeleben
# sudo service fabric-agent status
fabric-agent.service - fabric agent
   Loaded: loaded (/usr/lib/systemd/system/fabric-agent.service; enabled)
   Active: active (running) since Thu 2016-06-02 17:56:39 UTC; 3 days ago
  Process: 50643 ExecStartPre=/bin/rm -f /var/run/fabric-agent.pid (code=exited, status=0/SUCCESS)
 Main PID: 50645 (java)
   CGroup: /system.slice/fabric-agent.service
  1. Anzeigen des Status gestoppter/fehlgeschlagener Container 
# sudo docker inspect fabric-zookeeper | grep -A12 State
    "State": {
        "Status": "running",
        "Running": true,
        "Paused": false,
        "Restarting": false,
        "OOMKilled": false,
        "Dead": false,
        "Pid": 80462,
        "ExitCode": 0,
        "Error": "",
        "StartedAt": "2016-06-06T17:29:12.968133861Z",
        "FinishedAt": "2016-06-06T17:29:12.882812946Z"
    },
 
Wenn Sie sich immer noch nicht sicher sind, ob ein Problem vorliegt oder nicht, wenden Sie sich an den technischen Support von ECS, um weitere Unterstützung zu erhalten.

Betroffene Produkte

ECS Appliance Software without Encryption

Produkte

ECS Appliance, ECS Appliance Software with Encryption, ECS Appliance Software without Encryption
Artikeleigenschaften
Artikelnummer: 000064491
Artikeltyp: Solution
Zuletzt geändert: 17 Dez. 2025
Version:  6
Antworten auf Ihre Fragen erhalten Sie von anderen Dell NutzerInnen
Support Services
Prüfen Sie, ob Ihr Gerät durch Support Services abgedeckt ist.