Mitä tehdä, kun solmun tilana on Poissa käytöstä tai offline-tilassa

Summary: Ohjeet sen selvittämiseen, onko solmu alhaalla ja miten muodostetaan yhteys laskutilassa olevaan solmuun.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

Aina kun solmulla on ongelmia tiedonsiirrossa klusterin muiden solmujen kanssa, se ilmoitetaan offline-tilassa. Solmun tai solmujen ilmoittamiseen tässä tilassa on monia syitä laitteistosta käyttöjärjestelmään. Yleisin solmun kaatumisen merkki on tapahtumaviesteissä. Jos solmu menettää yhteyden klusterin muihin solmuihin, raportoidaan solmun offline-tilatapahtuma:

2.21767  02/27 05:14 C    3    173520         Node 3 is offline

 

Jos näet tämänkaltaisen tapahtuman, selvitä, onko solmu palautunut vai onko se edelleen offline-tilassa. Voit selvittää tämän käyttämällä tulosta isi-tilasta.

Jos isi-tilatuloste ilmoittaa kaikkien solmujen tilan olevan OK:

testcluster-1# isi status
Cluster Name: testcluster
Cluster Health:     [  OK ]
Data Reduction:     1.33 : 1
Storage Efficiency: 0.72 : 1
Cluster Storage:  HDD                 SSD Storage
Size:             0 (0 Raw)           16.7T (20.3T Raw)
VHS Size:         3.6T
Used:             0 (n/a)             22.0G (< 1%)
Avail:            0 (n/a)             16.7T (> 99%)

                   Health Ext  Throughput (bps)  HDD Storage      SSD Storage
ID |IP Address     |DASR |C/N|  In   Out  Total| Used / Size     |Used / Size
---+----------------+-----+---+-----+-----+-----+-----------------+-----------------
  1|xxx.xxx.xxx.148 | OK  | C |    0| 524k| 524k|(No Storage HDDs)| 6.4G/ 5.6T(< 1%)
  2|xxx.xxx.xxx.149 | OK  | C |962.0|23.1M|23.1M|(No Storage HDDs)| 6.4G/ 5.6T(< 1%)
  3|xxx.xxx.xxx.150 | OK  | C |    0|    0|    0|(No Storage HDDs)| 9.2G/ 5.6T(< 1%)
---+----------------+-----+---+-----+-----+-----+-----------------+-----------------
Cluster Totals:              |962.0|23.7M|23.7M|(No Storage HDDs)|22.0G/16.7T(< 1%)

     Health Fields: D = Down, A = Attention, S = Smartfailed, R = Read-Only
           External Network Fields: C = Connected, N = Not Connected

Critical Events:
Time            LNN  Event
--------------- ---- -------------------------------------------------------


Cluster Job Status:

No running jobs.

No paused or waiting jobs.

No failed jobs.

Recent job results:
Time            Job                        Event
--------------- -------------------------- ------------------------------
02/27 04:00:38  ShadowStoreProtect[518]    Succeeded
02/27 02:00:14  WormQueue[517]             Succeeded
 

Tässä esimerkissä kaikkien solmujen tilana on OK. Tämä tarkoittaa, että kaikki solmut ovat online-tilassa ja osa klusteria. Selvitä, käynnistikö joku solmun uudelleen vai suoritettiinko ylläpitoa. Jos et ole varma uudelleenkäynnistyksen syystä, kerää lokit ja avaa palvelupyyntö.

Jos isi-tila ilmoittaa solmun kohdassa Huomio:

testcluster-1# isi status
Cluster Name: testcluster
Cluster Health:     [ ATTN]
Data Reduction:     1.33 : 1
Storage Efficiency: 0.72 : 1
Cluster Storage:  HDD                 SSD Storage
Size:             0 (0 Raw)           15.0T (18.6T Raw)
VHS Size:         3.6T
Used:             0 (n/a)             21.2G (< 1%)
Avail:            0 (n/a)             15.0T (> 99%)

                   Health Ext  Throughput (bps)  HDD Storage      SSD Storage
ID |IP Address     |DASR |C/N|  In   Out  Total| Used / Size     |Used / Size
---+---------------+-----+---+-----+-----+-----+-----------------+-----------------
  1|xxx.xxx.xxx.148 | OK  | C | 2.1k|16.9k|19.0k|(No Storage HDDs)| 6.4G/ 5.5T(< 1%)
  2|xxx.xxx.xxx.149 | OK  | C | 1.8M|10.0M|11.9M|(No Storage HDDs)| 6.4G/ 5.5T(< 1%)
  3|xxx.xxx.xxx.150 |-A-- | C | 4.0k|480.0| 4.5k|(No Storage HDDs)|10.7G/ 5.5T(< 1%)
---+----------------+-----+---+-----+-----+-----+-----------------+-----------------
Cluster Totals:              | 1.8M|10.0M|11.9M|(No Storage HDDs)|21.2G/15.0T(< 1%)

     Health Fields: D = Down, A = Attention, S = Smartfailed, R = Read-Only
           External Network Fields: C = Connected, N = Not Connected

Critical Events:
Time            LNN  Event
--------------- ---- -------------------------------------------------------


Cluster Job Status:

Running jobs:
Job                        Impact Pri Policy     Phase Run Time
-------------------------- ------ --- ---------- ----- ----------
FlexProtectLin[520]        Medium 1   MEDIUM     4/4   0:00:34
        Job Description: Working on nodes: None   and drives: node3:bay1

No paused or waiting jobs.

No failed jobs.

Recent job results:
Time            Job                        Event
--------------- -------------------------- ------------------------------
02/27 04:00:38  ShadowStoreProtect[518]    Succeeded
02/27 02:00:14  WormQueue[517]             Succeeded

Solmun isi-tilatuloste näkyy pisteessä Attention -A--, tämän laukaisee klusterin kriittinen tapahtuma. Huomio-tilassa oleva solmu on online-tilassa ja osa klusteria, mutta ilmoittaa ongelmasta. Voit käyttää isi-tapahtumaluetteloa nähdäksesi, mitä kriittisiä tapahtumia solmulle raportoidaan osoitteessa Huomio. Tässä tapauksessa syynä oli FlexProtectLin-työ asemapaikassa 1. Kuten OK-tilassa, haluat selvittää, miksi solmu käynnistyi uudelleen, jos voit. Jos ei, kerää lokit ja avaa palvelupyyntö.

Jos isi-tila ilmoittaa solmun olevan poissa käytöstä:

testcluster-1# isi status
Cluster Name: testcluster
Cluster Health:     [ ATTN]
Data Reduction:     1.33 : 1
Storage Efficiency: 0.72 : 1
Cluster Storage:  HDD                 SSD Storage
Size:             0 (0 Raw)           9.9T (13.5T Raw)
VHS Size:         3.6T
Used:             0 (n/a)             12.7G (< 1%)
Avail:            0 (n/a)             9.9T (> 99%)

                   Health Ext  Throughput (bps)  HDD Storage      SSD Storage
ID |IP Address     |DASR |C/N|  In   Out  Total| Used / Size     |Used / Size
---+---------------+-----+---+-----+-----+-----+-----------------+-----------------
  1|xxx.xxx.xxx.148 | OK  | C |    0|73.9k|73.9k|(No Storage HDDs)| 6.4G/ 5.0T(< 1%)
  2|xxx.xxx.xxx.149 | OK  | C |    0|11.3k|11.3k|(No Storage HDDs)| 6.4G/ 5.0T(< 1%)
  3|xxx.xxx.xxx.150 |D--- | N |  n/a|  n/a|  n/a|  n/a/  n/a( n/a)|  n/a/  n/a( n/a)
---+---------------+-----+---+-----+-----+-----+-----------------+-----------------
Cluster Totals:              |  n/a|  n/a|  n/a|(No Storage HDDs)|12.7G/ 9.9T(< 1%)

     Health Fields: D = Down, A = Attention, S = Smartfailed, R = Read-Only
           External Network Fields: C = Connected, N = Not Connected

Critical Events:
Time            LNN  Event
--------------- ---- -------------------------------------------------------
02/27 05:14:20  3    Node 3 offline


Cluster Job Status:

No running jobs.

No paused or waiting jobs.

No failed jobs.

Recent job results:
Time            Job                        Event
--------------- -------------------------- ------------------------------
02/27 04:00:38  ShadowStoreProtect[518]    Succeeded
02/27 02:00:14  WormQueue[517]             Succeeded
02/27 00:00:21  ShadowStoreDelete[516]     Succeeded

SI-tilan tulossa solmun tilana näkyy Down D---, tämä tarkoittaa, että solmu ei pysty kommunikoimaan klusterin kanssa. Jos solmu ei ole poissa käytöstä tunnetusta syystä (esimerkiksi laitteiston ylläpitotoimia tehdään tai klusterin käyttöjärjestelmää päivitetään jne.), tarkista, voitko muodostaa yhteyden solmuun ja avaa palvelupyyntö heti.

Yhteyden muodostaminen alasolmuun etäyhteyden kautta

Jos solmu ei ole toiminnassa, se ei voi kommunikoida klusterin kanssa. On kuitenkin mahdollista, että voit silti muodostaa yhteyden solmuun. Voit ehkä silti kirjautua sisään etänä tai sarjayhteyden kautta.

Klusterin toisesta solmusta voit yrittää muodostaa yhteyden alasolmuun sisäisen verkon avulla. Yritätkö lähettää ping-komennon clustername-node number? Solmun 3 käyttäminen yllä olevasta lähdöstä:

testcluster-1# ping testcluster-3
PING testcluster-3 (128.221.254.3): 56 data bytes
64 bytes from 128.221.254.3: icmp_seq=0 ttl=64 time=0.048 ms
64 bytes from 128.221.254.3: icmp_seq=1 ttl=64 time=0.042 ms
64 bytes from 128.221.254.3: icmp_seq=2 ttl=64 time=0.043 ms
^C
--- testcluster-3 ping statistics ---
3 packets transmitted, 3 packets received, 0.0% packet loss

 Tässä esimerkissä pystyimme suorittamaan ping-komennon clustername-node number, vaikka solmu ilmoittaa sen olevan alhaalla. Yritämme muodostaa ssh-yhteyden solmuun ja katsoa, voimmeko muodostaa yhteyden.

Jos solmulla on staattisesti määritetty IP-osoite julkisessa verkossasi, voit ehkä muodostaa yhteyden siihen. Voit selvittää, onko sinulla staattisesti määritetty osoite klusterista, käyttämällä isi network -komentoa:
 

testcluster-1# isi network interfaces list | grep Static
1    25gige-1     Up         -        groupnet0.subnet0.pool0 Static      192.168.1.148
2    25gige-1     Up         -        groupnet0.subnet0.pool0 Static      192.168.1.149
3    25gige-1     Unknown    -        groupnet0.subnet0.pool0 Static      192.168.1.150

 Tässä esimerkissä klusterin solmun 3 staattisesti määritetty osoite on 192.168.1.150. Yritämme lähettää ping-kutsun klusterin toisesta solmusta tai työasemasta, jolla on pääsy kyseiseen verkkoon. Jos osoitteen ping-kutsu onnistuu, solmuun yritetään muodostaa ssh-yhteys.

Yhteyden muodostaminen alasolmuun paikallisesti

Jos joku on paikan päällä ja hänellä on tietokone, jossa on sarjaportti tai usb-sarjasovitin ja tyhjä modeemikaapeli tai sarjakaapeli nollamodeemisovittimella. Ne voivat muodostaa yhteyden suoraan solmuun vianmääritystä varten. Tietoja yhteyden muodostamisesta solmun sarjaporttiin on PowerScalessa: Miten asiakkaat voivat muodostaa yhteyden sarjaporttiin, kun etäyhteys ei ole mahdollinen

Affected Products

PowerScale, Isilon Gen6.5, Isilon Gen6, Isilon NL-Series, PowerScale OneFS, Isilon S-Series, Isilon Scale-out NAS, Isilon X-Series
Article Properties
Article Number: 000290053
Article Type: How To
Last Modified: 02 Jul 2025
Version:  1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.