Data Domain HA (DDHA) cihazları için sağlık kontrolü

Summary: Bu makale, bir hizmet olayından sonra temel HA sistem sağlık kontrolü gerçekleştirmeye yönelik rehberlik sağlamayı amaçlamaktadır. Data Domain Yüksek Düzeyde Kullanılabilir (DDHA) yapılandırmaları, kullanılan Data Domain modellerine bağlı olarak değişir. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Data Domain Yüksek Düzeyde Erişilebilir sistemler (DDHA), düğümler arasında yük devretmek için tasarlanmıştır.  Bekleme düğümü, aktif düğümün (AKTİF - PASİF) yerini almak için bir arıza olayı beklerken yalnızca aktif düğüm üretimdedir. 
Bir arıza olursa her iki DDHA düğümünün de çalışır durumda olduğunu kontrol etmek ve yük devretme işlemini tamamlamak zorunludur. 
Bu makalede ayrıntılı olarak açıklanan CLI komutları, yük devretmenin başarılı olmasını engelleyebilecek olası sorunların ortaya çıkarılmasına yardımcı olur. 
Bu kılavuz, kontrol edilmesi gereken temel alanlara ayrılmıştır.
  • HA Donanımı ve Yapılandırması
  • Filesystem
HA Ağ Sorun Giderme

# net show settings
Ağ bağlantı noktası ayarları, #net show settings komutunun hangi düğümde çalıştırıldığına bağlı olarak farklılık gösterir. DDHA sistemlerindeki yapılandırılmış bağlantı noktalarının tipi "kayan" veya "sabit"tir.  Her iki
 "net show settings"
düğümde de çalıştırın ve çıktıları karşılaştırın.
  1. "Kayan" arayüzler:  Aktif düğümde etkin ve çalışır durumda görünen yapılandırılmış herhangi bir Network Card (NIC) (Ağ Kartı) bağlantı noktası, takma ad veya veth'in yedek düğümde de aynı etkin ve çalışır durumda olduğunu doğrulayın.  Yapılandırılmış herhangi bir NIC bağlantı noktasının, diğer adın veya Veth'in kayan tipe ayarlanmış bir IP adresinin aktif düğümde ve bekleme düğümünde karşılık gelen bir N/A (Geçerli Değil) görüntülenmesi beklenir. 
  2. "Sabit" arayüzler: Sabit" olarak etiketlenen herhangi bir yapılandırılmış NIC bağlantı noktasının, diğer adın veya veth'in "enabled and running" (etkin ve çalışıyor) durumunu gösterdiğini doğrulayın. "Sabit" arayüzler, düğümler arasında aynı yapılandırmalara sahip değildir
  3. HA ara bağlantısının (veth99) görüntülendiğini ve gerekli tüm bağlantı noktalarının etkin ve çalışır durumda olduğunu doğrulayın, Not:  HA ara bağlantısı (veth99) için gerekli bağlantı noktası bağlantılarının sayısı ve yuva konumu DD modeline özgüdür

Aktif düğüm:
# net show settings
port     enabled   state     DHCP   IP address                             netmask          type           additional setting
------   -------   -------   ----   ------------------------------------   --------------   ------------   -----------------------------------------------
ethMa    yes       running   no     10.25.18.50                            255.255.255.0       fixed
                                           2620:0:170:1608:260:16ff:fe5c:92bc**   /64
                                                fe80::260:16ff:fe5c:92bc**        /64
ethMb    no        down      ipv4   n/a                                           n/a          fixed
ethMc    no        down      ipv4   n/a                                           n/a          fixed
ethMd    no        down      ipv4   n/a                                           n/a          fixed
eth4a    yes       running   no     10.25.18.63                            255.255.255.0       floating
                                           2620:0:170:1608:260:16ff:fe51:8c60**   /64
                                               fe80::260:16ff:fe51:8c60**         /64
eth4b    no        down       no     n/a                                          n/a          fixed
eth4c    no        down       no     n/a                                          n/a          fixed
eth4d    no        down       no     n/a                                          n/a          fixed
eth5a    no        down       no     n/a                                          n/a          fixed
eth5b    yes       running   no     10.25.18.60                            255.255.255.0       floating
                                           2620:0:170:1608:260:16ff:fe52:2951**   /64
                                                fe80::260:16ff:fe52:2951**        /64
eth5c    no        down       no     n/a                                          n/a          fixed
eth5d    no        down       no     n/a                                          n/a          fixed
eth11a   yes       running   n/a    n/a                                           n/a          interconnect   bonded to veth99
eth11b   yes       running   n/a    n/a                                           n/a          interconnect   bonded to veth99
eth11c   yes       running   n/a    n/a                                           n/a          interconnect   bonded to veth99
eth11d   yes       running   n/a    n/a                                           n/a          interconnect   bonded to veth99
veth99   yes       running   no     d:d:d:d:d:0060:1652:0ecc                 /80               interconnect   lacp hash xor-L3L4: eth11a,eth11b,eth11c,eth11d
                                                 fe80::260:16ff:fe52:ecc**   /64
------   -------   -------   ----   ------------------------------------   --------------   ------------   -----------------------------------------------
Bekleme düğümü:
# net show settings
port     enabled   state     DHCP   IP address                             netmask          type           additional setting
------   -------   -------   ----   ------------------------------------   --------------   ------------   -----------------------------------------------
ethMa    yes       running   no     10.25.18.49                            255.255.255.0    fixed
                                     2620:0:170:14567:260:16ff:fe5c:dr3**  /64
                                               fe80::260:16ff:fe5c3457c**  /64
ethMb    no        down      ipv4   n/a                                    n/a              fixed
ethMc    no        down      ipv4   n/a                                    n/a              fixed
ethMd    no        down      ipv4   n/a                                    n/a              fixed
eth4a    yes       running   no     n/a                                    255.255.255.0    floating
                                    2620:0:170:1608:260:1ght6:fe51:4570**  /64
                                               fe80::260:16ff:fe51:7890**  /64
eth4b    no        down       no     n/a                                   n/a              fixed
eth4c    no        down       no     n/a                                   n/a              fixed
eth4d    no        down       no     n/a                                   n/a              fixed
eth5a    no        down       no     n/a                                   n/a              fixed
eth5b    yes       running    no     n/a                                   255.255.255.0    floating
                                     2620:0:170:160:456:16ff:fe5234561**   /64
                                              fe80::260:16ff:fe52:3456**   /64
eth5c    no        down       no     n/a                                   n/a              fixed
eth5d    no        down       no     n/a                                   n/a              fixed
eth11a   yes       running    n/a    n/a                                   n/a              interconnect   bonded to veth99
eth11b   yes       running    n/a    n/a                                   n/a              interconnect   bonded to veth99
eth11c   yes       running    n/a    n/a                                   n/a              interconnect   bonded to veth99
eth11d   yes       running    n/a    n/a                                   n/a              interconnect   bonded to veth99
veth99   yes       running    no     d:d:d:d:d:0e456:1652:dft4c            /80              interconnect   lacp hash xor-L3L4: eth11a,eth11b,eth11c,eth11d
                                                 fe80::264:16ff:fec2:ecb** /64
------   -------   -------   ----   ------------------------------------   --------------   ------------   -----------------------------------------------
 
Ağ bağlantısını doğrulayın.
Her düğümde listelenen IP'leri gözden geçirin ve aktif düğüm ve bekleme düğümlerindeki her yapılandırılmış IP adresinin yapılandırılmış ağ geçidine ping gönderebildiğinden emin olun. 
Not: Bazı müşterilerin ortamlarında ping (ICMP) devre dışı bırakılmıştır.  Bu durumda, bağlantıyı doğrulamak için müşteriyle iletişime geçin.

 
(active:1)# net route show gateway detailed 
IPv4 Default Gateways
gateway IP   source   tables   interface address   owner
----------   ------   ------   -----------------   -----
10.25.18.1   static   tethMa   10.25.18.50/24      none
10.25.18.1   static   teth4a   10.25.18.63/24      none
10.25.18.1   static   teth5b   10.25.18.60/24      none
----------   ------   ------   -----------------   -----

Yapılandırılmış her ethxx ile ağ geçidi IP adresine ping atın.
 
#(active:1)# ping 10.25.18.1 interface ethMa
                                                           PING 10.25.18.1 (10.25.18.1) from 10.25.18.50 ethMa: 56(84) bytes of data.
                                                           64 bytes from 10.25.18.1: icmp_seq=0 ttl=255 time=0.697 ms
(active:1)# ping 10.25.18.1 interface eth4a
                                                           PING 10.25.18.1 (10.25.18.1) from 10.25.18.63 eth4a: 56(84) bytes of data.
                                                           64 bytes from 10.25.18.1: icmp_seq=0 ttl=255 time=1.31 ms
(active:1)# ping 10.25.18.1 interface eth5b
                                                          PING 10.25.18.1 (10.25.18.1) from 10.25.18.63 eth4a: 56(84) bytes of data.
                                                          64 bytes from 10.25.18.1: icmp_seq=0 ttl=255 time=1.31 ms
 
# net troubleshooting duplicate-ip
Her iki düğümden yinelenen IP'leri kontrol edin
No duplicate IP addresses detected

Fiber Kanal Testi
Bu özelliklerin lisanslı olduğunu doğrulayın ve ardından tamamen işlevsel olduklarını doğrulamak için bu özellikleri test edin (Örneğin: VTL'ye test yedekleme işlemleri çalıştırın)
# license show  or # elicense show

##   License Key           Feature
--   -------------------   ----------------------------------------
1    WTXV-TSWX-HWDR-RHDX  VTL
2    EZXW-SZZF-BGCS-VRZX   Block services (Vdisk)
3 .... HA

Hem etkin hem de beklemede otomatik destek ve uyarı testi
 
 (active:1)## autosupport test alert-summary
                              OK: Message sent.
 (active:1)## autosupport test support-notify
                              OK: Message sent.
 
 (standby:0)# autosupport test alert-summary
                              OK: Message sent.
 (standby:0)# autosupport test support-notify
                              OK: Message sent.


ASUP'leri Data Domain'e iletmek için CONNECTEMC (Secure Remote Services) kullanılıyorsa her iki düğümde de bağlantıyı doğrulamak için aşağıdaki komutu kullanın.
Zaman damgası, son bağlantının ne zaman kurulduğunu gösterir.
sysadmin@hostname# support connectemc show history
File Time Transport Result
--------------------------------------- --------------------- --------- --------
RSC_CKM00XXX601153_120315_092804166.xml "2015-12-03 09:28:07" HTTP Success
RSC_CKM00XXX601153_120315_101257767.xml "2015-12-03 10:13:00" HTTP Success
RSC_CKM00XXX601153_120315_111649065.xml "2015-12-03 11:16:53" HTTP Success
--------------------------------------- --------------------- --------- --------
Note: It says HTTP above, but it is HTTPS

HA Filesystem'da Sorun Giderme

# filesys status
Dosya sisteminin etkin ve çalışır durumda olduğunu doğrulayın. Temizleme durumu da görüntülenebilir.
The filesystem is enabled and running.
Cleaning started at 2016/08/20 14:12:16: phase 1 of 12 (pre-merge)
  0.7% complete, 95911 GiB free; time: phase  0:00:09, total  0:00:09

 
(active:1)#(standby:0)# system upgrade status
Her iki düğümde de tüm yükseltmelerin tamamlandığını doğrulayın.
Current Upgrade Status: DD OS upgrade Succeeded
End time: 2016.08.20:13:27
 
(active:1)#(standby:0)#Date
10 sn. içinde her iki düğümde de saat ve tarih eşleşmelerini sağlayın
-p1(active:1)# date
Sat Aug 20 14:34:29 EDT 2016
-p0(standby:0)# date
Sat Aug 20 14:34:17 EDT 2016

Aktif düğümden, müşteriyle birlikte DD çoğaltmasının (yapılandırılmışsa) beklendiği gibi çalıştığını doğrulayın.
# replication status
CTX   Destination                                                 Enabled   Connection         Sync'ed-as-of-time
---   ---------------------------------------------------------   -------   ----------------   ------------------
3     mtree://ddxxx.com/data/col1/eric.dest                        no        idle               Fri Nov  6 15:16
4     mtree://ddxxx.com/data/col1/thy-repl                         yes       idle               Fri Jul 22 15:38
5     dir://ddxxxx.com/backup/replicate-rtp                        yes       disconnected       Fri Jul 22 14:55
6     mtree://ddxxxx.com/data/col1/theman_test                     yes       idle               Sat Aug 20 22:11
7     dir://ddxxx.com/backup/lakeland/sym                          yes       Sat Aug 20 13:15   Fri Aug 19 15:09
---   ---------------------------------------------------------   -------   ----------------   ----------------

Cause

HA Donanımı ve Yapılandırması
 
# alerts show current

Hem aktif düğümde hem de bekleme düğümünde olası bir soruna işaret eden aktif bir uyarı olup olmadığını kontrol edin. Uyarılar her zaman düğümler arasında paylaşılmaz, bu nedenle her iki düğümü de kontrol edin.  Beklenmeyen bir sorunla karşılaşılırsa bir destek talebi oluşturun. Her zaman her iki düğümden de bir destek paketi oluşturun.
Not.  Uyarıların çoğu düğümlerden yalnızca birinde görülür. Her uyarı düğümler arasında paylaşılmaz.
 

Uyarı Örnekleri:

Severity   Class             Object   Message
   --------   ---------------   ------   ----------------------------------------------
CRITICAL      HardwareFailure            EVT-ENVIRONMENT-00049: The system detected an invalid hardware configuration.
--   ------------------------   --------   ---------------   ------   ----------------------------------------------
CRITICAL      HardwareFailure            EVT-ENVIRONMENT-00048: Filesystem can't be enabled due to an invalid hardware configuration.
--   ------------------------   --------   ---------------   ------   ----------------------------------------------
WARNING       HardwareFailure            Enclosure=1:Slot=5   EVT-ENVIRONMENT-00047: PCI communication speed is degraded
--   ------------------------   --------   ---------------   ------   ----------------------------------------------
WARNING             HA                   EVT-HA-00003: Standby node time is off by 15 second(s).
--   ------------------------   --------   ---------------   ------   ----------------------------------------------
WARNING    HardwareFailure   Port Index=1   EVT-MPATH-00003: Missing disk connection from system port 6a.
--   ------------------------   --------   ---------------   ------   ----------------------------------------------

 

# ha status

Geçerli HA durumunu belirlemek için etkin düğümde ve yedek düğümde #ha status komutu kullanılabilir.
Durum "yüksek oranda kullanılabilir" şeklindeyse yük devretme etkinleştirilir. 
Durum "degraded" (performansı düşürüldü) ise veya düğümlerden biri "online" (çevrimiçi) durumunu göstermiyorsa düğümler arası yük devretme devre dışı bırakılır.

 
SE@hostname-p0(active:0)## ha status
HA System name:hostname-n1.chaos.local
HA System status: highly available
 
Node Name                         Node id   Role      HA State
-------------------------------   -------   -------   --------
hostname-p0.chaos.local   0         active    online
hostname-p1.chaos.local   1         standby   online
-------------------------------   -------   -------   --------

# ha status detailed
#ha status detailed komutu aktif düğümde yalnızca HA durumuyla ilgili daha ayrıntılı bilgi için kullanılabilir.
Yansıtma Durumu bölümünde "not ok" (normal değil) olarak gösterilen aşağıdaki çıktılardan herhangi biri çalışmayan bir bileşene işaret eder ve HA Sistem Durumu "degraded" (performansı düşürüldü) olarak görüntülenir. 
Herhangi bir degraded (performansı düşürüldü) durum, düğümler arasında yük devretmeyi önler.

Not: Bu komut, bekleme düğümünde kullanılamaz.
 
SEhostname-p0(active:0)## ha status detailed
HA System name: hostname.chaos.local
HA System Status: highly available
Interconnect Status: ok
Primary Heartbeat Status:  ok
External LAN Heartbeat Status: not ok
Hardware compatibility check: ok
Software Version Check:   ok
 
Node hostname-p0.chaos.local:
        Role:      active
        HA State:  online
        Node Health: ok
 
Node hostname-p1.chaos.local:
        Role:     standby
        HA State: online
        Node Health: ok
 
Mirroring Status:
Component Name   Status
--------------   ------
nvram            ok
registry         ok
sms              ok
ddboost          ok
cifs             ok
--------------   ------


# enclosure show io-cards
Her iki düğümün de aynı, desteklenen yapılandırmalara sahip olduğunu doğrulayın.


# enclosure show misconfiguration
Donanım yapılandırmasıyla ilgili bir sorun olup olmadığını kontrol etmek için aktif düğüm ve bekleme düğümlerinde bir yanlış yapılandırma testi gerçekleştirin. 
Bkz. KB
https://www.dell.com/support/kbdoc/en-us/463399


Örnekler:
Memory DIMMs:
Locator Bank Locator Size(GiB) Status
------- ------------ --------- ----------
CHCD1     7     0     missing
CHDD1     7     0     missing
CHAD0     4     8     wrong size
CHBD0     4     8     wrong size
IO Cards:
Slot   Device       Status
----   ----------   ---------
10     Hera NVRAM   extra
10     Hera NVRAM   misplaced
----   ----------   ---------
CPUs:
    No misconfiguration found.
Disks:
Slot   Size(GiB)   Type   Media   Status
----   ---------   ----   -----   -------
2      186         SATA   SSD     missing
----   ---------   ----   -----   -----
 
# enclosure show topology
Her iki düğümün de topolojisini kontrol edin. 
Bağlantı noktaları arasında hata olup olmadığına bakın v
e tüm raf numaralandırmasının doğru olduğundan emin olun.
- Arızalar ve hatalar "?", "!" veya "!!" ile sembolize edilir
Not: Her düğüm için topoloji çıktıları birbirinin tersine çevrilmelidir (ayna görüntüsü).
 
(Stdby:0)## enclosure show topology
Port       enc.ctrl.port       enc.ctrl.port       enc.ctrl.port       enc.ctrl.port
----   -   -------------   -   -------------   -   -------------   -   -------------
2a
2b
2c
2d     >    5.A.E: 5.A.H   ?   4.A.E: 4.A.H   >    3.A.E: 3.A.H   >    2.A.E: 2.A.H
3a
3b
3c
3d
6a     !!    2.B.E: 2.B.H   >    3.B.E: 3.B.H   >    5.B.E: 5.B.H   >    ?.B.E: ?.B.H
6b
6c
6d
----   -   -------------   -   -------------   -   -------------   -   -------------
 
(active:1)## enclosure show topology
Port       enc.ctrl.port       enc.ctrl.port       enc.ctrl.port       enc.ctrl.port
----   -   -------------   -   -------------   -   -------------   -   -------------
2a
2b
2c
2d   >    2.A.H: 2.A.E   >    3.A.H: 3.A.E   >    4.A.H: 4.A.E   >    5.A.H: 5.A.E
3a
3b
3c
3d
6a    >    5.B.H: 5.B.E   >    4.B.H: 4.B.E   >    3.B.H: 3.B.E   >    2.B.H: 2.B.E
6b
6c
6d
----   -   -------------   -   -------------   -   -------------   -   -------------
 
# enclosure test topology all duration 1
Hem aktif hem de bekleme düğümlerinde, bağlı harici depolamaya sahip tüm SAS HBA bağlantı noktaları için 1 dakikalık bir tanılama testi gerçekleştirin.
Her iki düğümde aynı anda topoloji testi gerçekleştirmeyin. 
Beklenen sonuç, depolama takılı her bağlantı noktası için hata algılanmamasıdır. 
Bir sorun bulunursa test, arızalı SAS bağlantısını gösteren bir hata mesajıyla durabilir veya belirli bir bağlantıda hata (? ) gösterebilir
.

 
Not: Topoloji testi sırasında, her bir bağlantı noktasının durumu belirten ayrı bir çıkışı vardır. Sorunlu bağlantıyı tam olarak belirlemek için hataları (? , !) arayınHer bağlantı noktası testi tamamlanana kadar CLI çıkışı gösterilmez. 
 
# enclosure test topology  
Started: 1471719316
Ended: 1471719498
Duration: 182
Port      enc.ctrl.port       enc.ctrl.port       enc.ctrl.port       enc.ctrl.port
----  -  ---------------  -  ---------------  -  ---------------  -  ---------------
2d    >    5.A.H:5.A.E    >    4.A.H:4.A.E    >    3.A.H:3.A.E    >    2.A.H:2.A.E
----  -  ---------------  -  ---------------  -  ---------------  -  ---------------
Error message:
-----------------
No error detected
-----------------

# system show nvram
Hem aktif hem de bekleme düğümlerinde, Nvram pillerinin şarjlı veya şarj oluyor olduğundan ve tüm nvram hata sayaçlarının sıfır değerini gösterdiğinden emin olun.
 
# system show nvram
NVRAM Cards:
        Card   Component                 Value
        ----   -----------------------   ----------------------------------------------------------------------
        1      Slot                      0
               Firmware version          0.0.80
               Memory size               7.93 GiB
               Errors                    0 memory (0 uncorrectable), 0 PCI, 0 controller
               Flash controller Errors   0 Cfg Err, 0 PANIC, 0 Bus Hang, 0 Bad Blk Warn, 0 Bkup Err, 0 Rstr Err
               Board temperature         37 C
               CPU temperature           47 C
               Number of batteries       1
        ----   -----------------------   ----------------------------------------------------------------------
NVRAM Batteries:
        Card   Battery   Status   Charge   Charging   Time To       Temperature   Voltage
                                           Status     Full Charge
        ----   -------   ------   ------   --------   -----------   -----------   -------
        1      1         ok       94 %     enabled    0 mins        34 C          4.016 V
        ----   -------   ------   ------   --------   -----------   -----------   -------

Resolution

Daha fazla yardıma ihtiyaç duyarsanız sözleşmeli Servis Sağlayıcınızla iletişime geçin.

Additional Information

.

Affected Products

Data Domain

Products

Data Domain, DD OS 6.0
Article Properties
Article Number: 000017861
Article Type: Solution
Last Modified: 05 Jul 2024
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.