ECS: Kontejner je trvale mimo provoz: Symptom Code: 2021

Shrnutí: Tento článek znalostní databáze vysvětluje, proč systém ECS nahlásil, že kontejner je trvale mimo provoz.

Tento článek se vztahuje na Tento článek se nevztahuje na Tento článek není vázán na žádný konkrétní produkt. V tomto článku nejsou uvedeny všechny verze produktu.

Příznaky

Systém vytočil číslo domů s následující výstrahou:
Clarify Id: APMxxxxxxxx
Site Name: UNKNOWN
Vendor: EMC
DeviceType: ElasticCloudStorageApp
Model: ElasticCloudStorage
SerialNumber: APMxxxxxxxx
WWN: APMxxxxxxxx
Platform: platform
OS: SLES
OS_VER: 12.4
EmbedLevel: 2
InternalMaxSize: 512800
Comment: Fabric
Ucode_Ver: 3.7.0.6-7700.ed29023b
ConnectType: ESRS
IP_Address: Not Available
IP_Name: hostname.domainname.net
ConnectNum: 169.254.1.1
Port: 22

SymptomCode: 2021
Category: Status
Severity: Critical
Status: Failed
Component: Node
ComponentID: xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxx
SubComponent: Service
SubComponentID: <docker container name>
CallHome: true
FirstTime: 2023-12-09T07:48:20.232Z
Description: Container <container> is permanently down on node <node>

Příčina

Kontejner se zastavil, pozastavil nebo se vůbec nespustil po dobu nejméně 10 minut.

Řešení

Kontejnery Dockeru (object-main, fabric-lifecycle, fabric-zookeeper, fabric-registry) se zastavily nebo pozastavily nebo se vůbec nespustily po dobu alespoň 10 minut. K určení vadného kontejneru použijte následující postup:
  1. Na základě ID komponenty nebo ID uzlu určete uzel v clusteru ECS, který selhání zaregistroval. Příklad: ID součásti
4ca42022-46ed-475e-8ab7-6ef9141e5415
sudo /opt/emc/caspian/fabric/cli/bin/fcli lifecycle node.network --id 4ca42022-46ed-475e-8ab7-6ef9141e5415
{
  "network": {
    "hostname": "hostname.domainname.net",  << Hostname
    "private_ip": "169.254.1.3",       << NAN IP
    "mgmt_ip": "10.2.3.4",     << Management IP 
    "public_ip": "10.241.207.59",
    "data_ip": "10.241.207.73",
    "replication_ip": "10.241.207.59",
    "public_interface_name": "public",
    "private_interface_name": "private.4",
    "mgmt_interface_name": "public",
    "data_interface_name": "public:data",
    "replication_interface_name": "public"
  },
  "status": "OK",
  "etag": 50
}
  1.  Přihlaste se k cílovému uzlu přes SSH pomocí IP adresy pro správu, privátní IP adresy nebo názvu hostitele.
 
  1. Ověřte, že je docker server funkční se správnými parametry.
# ps -ef | grep docker
root      50062      1  0 Jun02 ?        00:02:11 /usr/bin/docker daemon -H fd:// --insecure-registry=0.0.0.0/0 --log-level=warn
  1. Dále musíme ověřit, který kontejner (sloupec NAMES) byl z nějakého důvodu zastaven nebo vůbec nespuštěn (podívejte se na sloupec STATUS):
# sudo docker ps -a
CONTAINER ID        IMAGE               COMMAND                  CREATED                STATUS              PORTS               NAMES
7bf16df0ef15        464b97154c24        "/opt/vipr/boot/boot."   3 days ago          Up 3 days                                    object-main
0ef5cc422543        24d9d6008893        "./boot.sh lifecycle"    3 days ago          Up 3 days                                    fabric-lifecycle
87d6c77d98ca        32cce433c3dc        "./boot.sh 3 1=169.25"   3 days ago          Up 3 days                                    fabric-zookeeper
  1. Ověřte, že je služba Fabric spuštěná. Agent topologie Fabric se pokusí problémový kontejner automaticky oživit
# sudo service fabric-agent status
fabric-agent.service - fabric agent
   Loaded: loaded (/usr/lib/systemd/system/fabric-agent.service; enabled)
   Active: active (running) since Thu 2016-06-02 17:56:39 UTC; 3 days ago
  Process: 50643 ExecStartPre=/bin/rm -f /var/run/fabric-agent.pid (code=exited, status=0/SUCCESS)
 Main PID: 50645 (java)
   CGroup: /system.slice/fabric-agent.service
  1. Zobrazení stavu zastaveného/vadného kontejneru 
# sudo docker inspect fabric-zookeeper | grep -A12 State
    "State": {
        "Status": "running",
        "Running": true,
        "Paused": false,
        "Restarting": false,
        "OOMKilled": false,
        "Dead": false,
        "Pid": 80462,
        "ExitCode": 0,
        "Error": "",
        "StartedAt": "2016-06-06T17:29:12.968133861Z",
        "FinishedAt": "2016-06-06T17:29:12.882812946Z"
    },
 
Pokud si stále nejste jisti, zda se jedná o problém, kontaktujte technickou podporu ECS a požádejte o další pomoc.

Dotčené produkty

ECS Appliance Software without Encryption

Produkty

ECS Appliance, ECS Appliance Software with Encryption, ECS Appliance Software without Encryption
Vlastnosti článku
Číslo článku: 000064491
Typ článku: Solution
Poslední úprava: 17 pro 2025
Verze:  6
Najděte odpovědi na své otázky od ostatních uživatelů společnosti Dell
Služby podpory
Zkontrolujte, zda se na vaše zařízení vztahují služby podpory.