Bir düğüm Kapalı veya Çevrimdışı olarak bildirildiğinde ne yapılması gerektiği

Zusammenfassung: Bir düğümün kapalı olup olmadığını belirleme ve düğüme kapalı durumda bağlanma yolları.

Dieser Artikel gilt für Dieser Artikel gilt nicht für Dieser Artikel ist nicht an ein bestimmtes Produkt gebunden. In diesem Artikel werden nicht alle Produktversionen aufgeführt.

Weisungen

Bir düğüm, kümedeki diğer düğümlerle iletişim kurarken sorun yaşadığında çevrimdışı olarak bildirilir. Donanımdan işletim sistemine kadar bir düğümün veya düğümlerin bu durumda raporlanmasının birçok nedeni vardır. Bir düğümün kapalı olduğunun en yaygın göstergesi olay mesajlarıdır. Bir düğümün kümedeki diğer düğümlerle bağlantısı kesilirse "düğüm çevrimdışı" olayı bildirilir:

2.21767  02/27 05:14 C    3    173520         Node 3 is offline

 

Buna benzer bir olay görürseniz düğümün kurtarılıp kurtarılmadığını veya hala çevrimdışı olup olmadığını belirleyin. Bunu belirlemek için isi status çıktısını kullanın.

Eğer isi status output tüm düğümlerin OK olduğunu bildiriyorsa:

testcluster-1# isi status
Cluster Name: testcluster
Cluster Health:     [  OK ]
Data Reduction:     1.33 : 1
Storage Efficiency: 0.72 : 1
Cluster Storage:  HDD                 SSD Storage
Size:             0 (0 Raw)           16.7T (20.3T Raw)
VHS Size:         3.6T
Used:             0 (n/a)             22.0G (< 1%)
Avail:            0 (n/a)             16.7T (> 99%)

                   Health Ext  Throughput (bps)  HDD Storage      SSD Storage
ID |IP Address     |DASR |C/N|  In   Out  Total| Used / Size     |Used / Size
---+----------------+-----+---+-----+-----+-----+-----------------+-----------------
  1|xxx.xxx.xxx.148 | OK  | C |    0| 524k| 524k|(No Storage HDDs)| 6.4G/ 5.6T(< 1%)
  2|xxx.xxx.xxx.149 | OK  | C |962.0|23.1M|23.1M|(No Storage HDDs)| 6.4G/ 5.6T(< 1%)
  3|xxx.xxx.xxx.150 | OK  | C |    0|    0|    0|(No Storage HDDs)| 9.2G/ 5.6T(< 1%)
---+----------------+-----+---+-----+-----+-----+-----------------+-----------------
Cluster Totals:              |962.0|23.7M|23.7M|(No Storage HDDs)|22.0G/16.7T(< 1%)

     Health Fields: D = Down, A = Attention, S = Smartfailed, R = Read-Only
           External Network Fields: C = Connected, N = Not Connected

Critical Events:
Time            LNN  Event
--------------- ---- -------------------------------------------------------


Cluster Job Status:

No running jobs.

No paused or waiting jobs.

No failed jobs.

Recent job results:
Time            Job                        Event
--------------- -------------------------- ------------------------------
02/27 04:00:38  ShadowStoreProtect[518]    Succeeded
02/27 02:00:14  WormQueue[517]             Succeeded
 

Bu örnekte, tüm düğümler iyi durumda olarak rapor verir. Bu, tüm düğümlerin çevrimiçi olduğunu ve kümenin bir parçası olduğunu gösterir. Düğümün birisinin yeniden başlatıp başlatmadığını veya bakım yapılıp yapılmadığını belirleyin. Yeniden başlatmanın nedeninden emin değilseniz günlükleri toplayabilir ve bir servis isteği açabilirsiniz.

Eğer isi status is report a node at Attention:

testcluster-1# isi status
Cluster Name: testcluster
Cluster Health:     [ ATTN]
Data Reduction:     1.33 : 1
Storage Efficiency: 0.72 : 1
Cluster Storage:  HDD                 SSD Storage
Size:             0 (0 Raw)           15.0T (18.6T Raw)
VHS Size:         3.6T
Used:             0 (n/a)             21.2G (< 1%)
Avail:            0 (n/a)             15.0T (> 99%)

                   Health Ext  Throughput (bps)  HDD Storage      SSD Storage
ID |IP Address     |DASR |C/N|  In   Out  Total| Used / Size     |Used / Size
---+---------------+-----+---+-----+-----+-----+-----------------+-----------------
  1|xxx.xxx.xxx.148 | OK  | C | 2.1k|16.9k|19.0k|(No Storage HDDs)| 6.4G/ 5.5T(< 1%)
  2|xxx.xxx.xxx.149 | OK  | C | 1.8M|10.0M|11.9M|(No Storage HDDs)| 6.4G/ 5.5T(< 1%)
  3|xxx.xxx.xxx.150 |-A-- | C | 4.0k|480.0| 4.5k|(No Storage HDDs)|10.7G/ 5.5T(< 1%)
---+----------------+-----+---+-----+-----+-----+-----------------+-----------------
Cluster Totals:              | 1.8M|10.0M|11.9M|(No Storage HDDs)|21.2G/15.0T(< 1%)

     Health Fields: D = Down, A = Attention, S = Smartfailed, R = Read-Only
           External Network Fields: C = Connected, N = Not Connected

Critical Events:
Time            LNN  Event
--------------- ---- -------------------------------------------------------


Cluster Job Status:

Running jobs:
Job                        Impact Pri Policy     Phase Run Time
-------------------------- ------ --- ---------- ----- ----------
FlexProtectLin[520]        Medium 1   MEDIUM     4/4   0:00:34
        Job Description: Working on nodes: None   and drives: node3:bay1

No paused or waiting jobs.

No failed jobs.

Recent job results:
Time            Job                        Event
--------------- -------------------------- ------------------------------
02/27 04:00:38  ShadowStoreProtect[518]    Succeeded
02/27 02:00:14  WormQueue[517]             Succeeded

Düğümdeki isi durum çıktısı, Dikkat -A konumunda gösterir--, Bu, kümede kritik bir olay olduğunu gösterir. Dikkat durumundaki bir düğüm çevrimiçi ve kümenin bir parçası, ancak bir sorun bildiriyor. Dikkat bölümündeki düğüm için hangi kritik olayların rapor edildiğini görmek için isi event list ögesini kullanabilirsiniz. Bu durumda, sorunun nedeni 1 numaralı sürücü bölmesi için çalışan bir FlexProtectLin işiydi. OK durumunda olduğu gibi, mümkünse düğümün neden yeniden başlatıldığını belirlemek isteyebilirsiniz. Değilse günlükleri toplayıp bir servis isteği açabilirsiniz.

If isi status is report a node as Down:

testcluster-1# isi status
Cluster Name: testcluster
Cluster Health:     [ ATTN]
Data Reduction:     1.33 : 1
Storage Efficiency: 0.72 : 1
Cluster Storage:  HDD                 SSD Storage
Size:             0 (0 Raw)           9.9T (13.5T Raw)
VHS Size:         3.6T
Used:             0 (n/a)             12.7G (< 1%)
Avail:            0 (n/a)             9.9T (> 99%)

                   Health Ext  Throughput (bps)  HDD Storage      SSD Storage
ID |IP Address     |DASR |C/N|  In   Out  Total| Used / Size     |Used / Size
---+---------------+-----+---+-----+-----+-----+-----------------+-----------------
  1|xxx.xxx.xxx.148 | OK  | C |    0|73.9k|73.9k|(No Storage HDDs)| 6.4G/ 5.0T(< 1%)
  2|xxx.xxx.xxx.149 | OK  | C |    0|11.3k|11.3k|(No Storage HDDs)| 6.4G/ 5.0T(< 1%)
  3|xxx.xxx.xxx.150 |D--- | N |  n/a|  n/a|  n/a|  n/a/  n/a( n/a)|  n/a/  n/a( n/a)
---+---------------+-----+---+-----+-----+-----+-----------------+-----------------
Cluster Totals:              |  n/a|  n/a|  n/a|(No Storage HDDs)|12.7G/ 9.9T(< 1%)

     Health Fields: D = Down, A = Attention, S = Smartfailed, R = Read-Only
           External Network Fields: C = Connected, N = Not Connected

Critical Events:
Time            LNN  Event
--------------- ---- -------------------------------------------------------
02/27 05:14:20  3    Node 3 offline


Cluster Job Status:

No running jobs.

No paused or waiting jobs.

No failed jobs.

Recent job results:
Time            Job                        Event
--------------- -------------------------- ------------------------------
02/27 04:00:38  ShadowStoreProtect[518]    Succeeded
02/27 02:00:14  WormQueue[517]             Succeeded
02/27 00:00:21  ShadowStoreDelete[516]     Succeeded

isi durum çıktısı, düğümü Down D olarak gösterir---, bu, düğümün kümeyle iletişim kuramadığını gösterir. Düğüm bilinen bir nedenle çalışmıyorsa düğümle bağlantı kurup kuramadığınıza bakın ve hemen bir servis isteği açın.

Kapatılan bir düğüme uzaktan bağlantı kurma

Düğüm çalışmıyorsa, kümeyle iletişim kuramadığı anlamına gelir. Yine de düğüme bağlanabilmeniz mümkündür. Yine de uzaktan veya seri bağlantı yoluyla oturum açabilirsiniz.

Kümedeki başka bir düğümden, dahili ağı kullanarak aşağı düğüme bağlanmayı deneyebilirsiniz. clustername-node numarasına ping göndermeyi deneyin. Yukarıdaki çıktıdan düğüm 3'ü kullanarak:

testcluster-1# ping testcluster-3
PING testcluster-3 (128.221.254.3): 56 data bytes
64 bytes from 128.221.254.3: icmp_seq=0 ttl=64 time=0.048 ms
64 bytes from 128.221.254.3: icmp_seq=1 ttl=64 time=0.042 ms
64 bytes from 128.221.254.3: icmp_seq=2 ttl=64 time=0.043 ms
^C
--- testcluster-3 ping statistics ---
3 packets transmitted, 3 packets received, 0.0% packet loss

 Bu örnekte, düğüm kapalı olarak rapor verse bile clustername-node numarasına ping gönderebiliriz. Düğüme SSH göndermeyi deneyeceğiz ve bağlanıp bağlanamayacağımızı göreceğiz.

Düğümün genel ağınızda statik olarak atanmış bir IP adresi varsa bu adrese bağlanabilirsiniz. Kümeden statik olarak atanmış bir adresiniz olup olmadığını belirlemek için isi network komutunu kullanın:
 

testcluster-1# isi network interfaces list | grep Static
1    25gige-1     Up         -        groupnet0.subnet0.pool0 Static      192.168.1.148
2    25gige-1     Up         -        groupnet0.subnet0.pool0 Static      192.168.1.149
3    25gige-1     Unknown    -        groupnet0.subnet0.pool0 Static      192.168.1.150

 Bu örnekte, kümedeki düğüm 3, 192.168.1.150'de statik olarak atanmış bir adrese sahiptir. Kümedeki başka bir düğümden veya o ağa erişimi olan bir iş istasyonundan adrese ping göndermeyi deneriz. Adrese başarılı bir şekilde ping gönderebilirsek düğüme SSH göndermeyi deneriz.

Aşağı bir düğüme yerel olarak bağlantı kurma

Birisi sahadaysa ve:

  • Seri bağlantı noktası veya usb'den seriye adaptörü olan bir bilgisayarları var
  • Boş modem kablosu veya boş modem bağdaştırıcılı seri kablo.
Sorun giderme amacıyla doğrudan düğüme bağlanabilirler. Düğümdeki seri bağlantı noktasına bağlanma hakkında bilgiler PowerScale'de bulunabilir: Uzak bağlantı mümkün olmadığında müşterilerin seri bağlantı noktasına bağlanması için adımlar

Betroffene Produkte

PowerScale, Isilon Gen6.5, Isilon Gen6, Isilon NL-Series, PowerScale OneFS, Isilon S-Series, Isilon Scale-out NAS, Isilon X-Series
Artikeleigenschaften
Artikelnummer: 000290053
Artikeltyp: How To
Zuletzt geändert: 06 Feb. 2026
Version:  2
Antworten auf Ihre Fragen erhalten Sie von anderen Dell NutzerInnen
Support Services
Prüfen Sie, ob Ihr Gerät durch Support Services abgedeckt ist.