Data Domain HA (DDHA) -laitteiden kuntotarkistus

Summary: Tämän artikkelin tarkoituksena on opastaa perustason HA-järjestelmän kuntotarkistuksen suorittamiseen huoltotapahtuman jälkeen. DDHA (Data Domain Highly Availability) -määritykset vaihtelevat käytettyjen Data Domain -mallien mukaan. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Data Domain Highly Available (DDHA) -järjestelmät on suunniteltu vikaantumaan solmujen välillä.  Vain aktiivinen solmu on tuotannossa, kun valmiussolmu odottaa virhetapahtumaa, joka korvaa aktiivisen solmun (ACTIVE - PASSIIVINEN). 
On välttämätöntä tarkistaa, että molemmat DDHA-solmut ovat toimintakunnossa, ja suorittaa vikasietoisuus, jos vika ilmenee. 
Tässä artikkelissa kuvatut komentoriviliittymän komennot auttavat havaitsemaan mahdollisia ongelmia, jotka voivat estää onnistuneen vikasietoisuuden. 
Tämä opas on jaettu avainalueisiin, jotka tulisi tarkistaa.
  • HA-laitteisto ja -kokoonpano
  • Verkko
  • Tiedostojärjestelmä
HA-verkon vianmääritys
 
# net show -asetukset  
Verkkoportin asetukset vaihtelevat sen mukaan, missä solmussa #net näytä asetukset -komento suoritetaan. DDHA-järjestelmien määritettyjen porttien tyyppi on floating tai type fixed.  Suorita
 "net show settings"
molemmissa solmuissa ja vertaa tuloksia.
  1. "Kelluvat" liitännät:  Varmista, että kaikilla määritetyillä verkkokortin (NIC) porteilla, aliaksella tai veth-porteilla, jotka näyttävät käytössä ja käynnissä -tilan aktiivisessa solmussa, on sama käytössä ja käynnissä oleva tila valmiussolmussa.  Minkä tahansa määritetyn verkkokorttiportin, aliaksen tai Vethin, jonka tyyppi on kelluva, IP-osoite näkyy aktiivisessa solmussa ja vastaava N/A valmiussolmussa. 
  2. "Kiinteät" liitännät: Varmista, että kaikissa määritetyissä kiinteiksi merkityissä verkkokorttiporteissa, aliaksissa tai veth-verkoissa näkyy käytössä ja käynnissä oleva tila. "Kiinteillä" rajapinnoilla ei ole identtisiä kokoonpanoja solmujen välillä
  3. Varmista, että HA-yhteys (veth99) on näytössä ja että kaikki tarvittavat portit ovat käytössä ja käynnissä. Huomautus:  HA-liitännässä (veth99) tarvittavien porttiliitäntöjen määrä ja paikkojen sijainti on DD-mallikohtainen

Aktiivinen solmu:
# net show settings
port     enabled   state     DHCP   IP address                             netmask          type           additional setting
------   -------   -------   ----   ------------------------------------   --------------   ------------   -----------------------------------------------
ethMa    yes       running   no     10.25.18.50                            255.255.255.0       fixed
                                           2620:0:170:1608:260:16ff:fe5c:92bc**   /64
                                                fe80::260:16ff:fe5c:92bc**        /64
ethMb    no        down      ipv4   n/a                                           n/a          fixed
ethMc    no        down      ipv4   n/a                                           n/a          fixed
ethMd    no        down      ipv4   n/a                                           n/a          fixed
eth4a    yes       running   no     10.25.18.63                            255.255.255.0       floating
                                           2620:0:170:1608:260:16ff:fe51:8c60**   /64
                                               fe80::260:16ff:fe51:8c60**         /64
eth4b    no        down       no     n/a                                          n/a          fixed
eth4c    no        down       no     n/a                                          n/a          fixed
eth4d    no        down       no     n/a                                          n/a          fixed
eth5a    no        down       no     n/a                                          n/a          fixed
eth5b    yes       running   no     10.25.18.60                            255.255.255.0       floating
                                           2620:0:170:1608:260:16ff:fe52:2951**   /64
                                                fe80::260:16ff:fe52:2951**        /64
eth5c    no        down       no     n/a                                          n/a          fixed
eth5d    no        down       no     n/a                                          n/a          fixed
eth11a   yes       running   n/a    n/a                                           n/a          interconnect   bonded to veth99
eth11b   yes       running   n/a    n/a                                           n/a          interconnect   bonded to veth99
eth11c   yes       running   n/a    n/a                                           n/a          interconnect   bonded to veth99
eth11d   yes       running   n/a    n/a                                           n/a          interconnect   bonded to veth99
veth99   yes       running   no     d:d:d:d:d:0060:1652:0ecc                 /80               interconnect   lacp hash xor-L3L4: eth11a,eth11b,eth11c,eth11d
                                                 fe80::260:16ff:fe52:ecc**   /64
------   -------   -------   ----   ------------------------------------   --------------   ------------   -----------------------------------------------
Valmiussolmu :
# net show settings
port     enabled   state     DHCP   IP address                             netmask          type           additional setting
------   -------   -------   ----   ------------------------------------   --------------   ------------   -----------------------------------------------
ethMa    yes       running   no     10.25.18.49                            255.255.255.0    fixed
                                     2620:0:170:14567:260:16ff:fe5c:dr3**  /64
                                               fe80::260:16ff:fe5c3457c**  /64
ethMb    no        down      ipv4   n/a                                    n/a              fixed
ethMc    no        down      ipv4   n/a                                    n/a              fixed
ethMd    no        down      ipv4   n/a                                    n/a              fixed
eth4a    yes       running   no     n/a                                    255.255.255.0    floating
                                    2620:0:170:1608:260:1ght6:fe51:4570**  /64
                                               fe80::260:16ff:fe51:7890**  /64
eth4b    no        down       no     n/a                                   n/a              fixed
eth4c    no        down       no     n/a                                   n/a              fixed
eth4d    no        down       no     n/a                                   n/a              fixed
eth5a    no        down       no     n/a                                   n/a              fixed
eth5b    yes       running    no     n/a                                   255.255.255.0    floating
                                     2620:0:170:160:456:16ff:fe5234561**   /64
                                              fe80::260:16ff:fe52:3456**   /64
eth5c    no        down       no     n/a                                   n/a              fixed
eth5d    no        down       no     n/a                                   n/a              fixed
eth11a   yes       running    n/a    n/a                                   n/a              interconnect   bonded to veth99
eth11b   yes       running    n/a    n/a                                   n/a              interconnect   bonded to veth99
eth11c   yes       running    n/a    n/a                                   n/a              interconnect   bonded to veth99
eth11d   yes       running    n/a    n/a                                   n/a              interconnect   bonded to veth99
veth99   yes       running    no     d:d:d:d:d:0e456:1652:dft4c            /80              interconnect   lacp hash xor-L3L4: eth11a,eth11b,eth11c,eth11d
                                                 fe80::264:16ff:fec2:ecb** /64
------   -------   -------   ----   ------------------------------------   --------------   ------------   -----------------------------------------------
 
Tarkista verkkoyhteydet.
Tarkista kunkin solmun IP-osoitteet ja varmista, että kukin määritetty IP-osoite aktiivisessa solmussa ja valmiustilassa olevalle solmulle voi lähettää ping-kutsun määritetylle yhdyskäytävälleen. 
Huomautus: Joillakin asiakkailla ping (ICMP) on poistettu käytöstä ympäristössään.  Pyydä tässä tapauksessa asiakasta vahvistamaan yhteys.

 
(aktiivinen:1)# net route show gateway detailed 
IPv4 Default Gateways
gateway IP   source   tables   interface address   owner
----------   ------   ------   -----------------   -----
10.25.18.1   static   tethMa   10.25.18.50/24      none
10.25.18.1   static   teth4a   10.25.18.63/24      none
10.25.18.1   static   teth5b   10.25.18.60/24      none
----------   ------   ------   -----------------   -----

Pingaa yhdyskäytävän IP-osoite kunkin määritetyn ethxx:n yhteydessä.
 
#(active:1)# ping 10.25.18.1 interface ethMa
                                                           PING 10.25.18.1 (10.25.18.1) from 10.25.18.50 ethMa: 56(84) bytes of data.
                                                           64 bytes from 10.25.18.1: icmp_seq=0 ttl=255 time=0.697 ms
(active:1)# ping 10.25.18.1 interface eth4a
                                                           PING 10.25.18.1 (10.25.18.1) from 10.25.18.63 eth4a: 56(84) bytes of data.
                                                           64 bytes from 10.25.18.1: icmp_seq=0 ttl=255 time=1.31 ms
(active:1)# ping 10.25.18.1 interface eth5b
                                                          PING 10.25.18.1 (10.25.18.1) from 10.25.18.63 eth4a: 56(84) bytes of data.
                                                          64 bytes from 10.25.18.1: icmp_seq=0 ttl=255 time=1.31 ms
 
# net-vianmääritys kaksoiskappale-IP
Tarkista kummastakin solmusta päällekkäiset IP-osoitteet
No duplicate IP addresses detected

Kuitukanavan testaus
Varmista, että näillä ominaisuuksilla on käyttöoikeus, ja testaa sitten nämä ominaisuudet varmistaaksesi, että ne ovat täysin toimivia (esimerkiksi: Testaa varmuuskopiointia VTL:lle)
# license show  or # elicense show

##   License Key           Feature
--   -------------------   ----------------------------------------
1    WTXV-TSWX-HWDR-RHDX  VTL
2    EZXW-SZZF-BGCS-VRZX   Block services (Vdisk)
3 .... HA

Automaattinen tuki ja hälytystestaus sekä aktiivisesta että valmiustilasta
 
 (active:1)## autosupport test alert-summary
                              OK: Message sent.
 (active:1)## autosupport test support-notify
                              OK: Message sent.
 
 (standby:0)# autosupport test alert-summary
                              OK: Message sent.
 (standby:0)# autosupport test support-notify
                              OK: Message sent.


Jos ASUPS-kynnyksellä Data Domainiin käytetään CONNECTEMC (Secure Remote Services) -teknologiaa, tarkista molempien solmujen yhteydet seuraavalla komennolla.
Aikaleima ilmaisee, milloin viimeinen yhteys muodostettiin.
sysadmin@hostname# support connectemc show history
File Time Transport Result
--------------------------------------- --------------------- --------- --------
RSC_CKM00XXX601153_120315_092804166.xml "2015-12-03 09:28:07" HTTP Success
RSC_CKM00XXX601153_120315_101257767.xml "2015-12-03 10:13:00" HTTP Success
RSC_CKM00XXX601153_120315_111649065.xml "2015-12-03 11:16:53" HTTP Success
--------------------------------------- --------------------- --------- --------
Note: It says HTTP above, but it is HTTPS

HA-tiedostojärjestelmän vianmääritys
 
# filesys-tila
Varmista, että näytön ilmaisin on käytössä ja käynnissä. Puhdistuksen tila voidaan myös näyttää.
The filesystem is enabled and running.
Cleaning started at 2016/08/20 14:12:16: phase 1 of 12 (pre-merge)
  0.7% complete, 95911 GiB free; time: phase  0:00:09, total  0:00:09

 
(aktiivinen:1)#(valmiustila:0)# Järjestelmäpäivityksen tila
Varmista kummassakin solmussa, että kaikki päivitykset on tehty.
Current Upgrade Status: DD OS upgrade Succeeded
End time: 2016.08.20:13:27
 
(aktiivinen:1)#(valmiustila:0)#Päivämäärä
Varmista, että aika ja päivämäärä vastaavat toisiaan molemmissa solmuissa 10 sekunnin kuluessa
-p1(active:1)# date
Sat Aug 20 14:34:29 EDT 2016
-p0(standby:0)# date
Sat Aug 20 14:34:17 EDT 2016

Varmista aktiivisessa solmussa, että DD-replikointi (jos määritetty) toimii odotetulla tavalla.
# replication status
CTX   Destination                                                 Enabled   Connection         Sync'ed-as-of-time
---   ---------------------------------------------------------   -------   ----------------   ------------------
3     mtree://ddxxx.com/data/col1/eric.dest                        no        idle               Fri Nov  6 15:16
4     mtree://ddxxx.com/data/col1/thy-repl                         yes       idle               Fri Jul 22 15:38
5     dir://ddxxxx.com/backup/replicate-rtp                        yes       disconnected       Fri Jul 22 14:55
6     mtree://ddxxxx.com/data/col1/theman_test                     yes       idle               Sat Aug 20 22:11
7     dir://ddxxx.com/backup/lakeland/sym                          yes       Sat Aug 20 13:15   Fri Aug 19 15:09
---   ---------------------------------------------------------   -------   ----------------   ----------------

Cause

HA-laitteisto ja -kokoonpano
 
# alerts show current

Tarkista, onko sekä aktiivisessa solmussa että valmiustilassa aktiivinen hälytys, joka viittaa mahdolliseen ongelmaan. Hälytyksiä ei aina jaeta solmujen kesken, joten tarkista molemmat solmut.  Jos kohtaat odottamattoman ongelman, lähetä tukipyyntö. Luo aina tukipaketti molemmista solmuista.
Huomautus:  Useimmat hälytykset näkyvät vain yhdessä solmussa. Kaikkia hälytyksiä ei jaeta solmujen välillä.
 

Esimerkkejä hälytyksistä:

Severity   Class             Object   Message
   --------   ---------------   ------   ----------------------------------------------
CRITICAL      HardwareFailure            EVT-ENVIRONMENT-00049: The system detected an invalid hardware configuration.
--   ------------------------   --------   ---------------   ------   ----------------------------------------------
CRITICAL      HardwareFailure            EVT-ENVIRONMENT-00048: Filesystem can't be enabled due to an invalid hardware configuration.
--   ------------------------   --------   ---------------   ------   ----------------------------------------------
WARNING       HardwareFailure            Enclosure=1:Slot=5   EVT-ENVIRONMENT-00047: PCI communication speed is degraded
--   ------------------------   --------   ---------------   ------   ----------------------------------------------
WARNING             HA                   EVT-HA-00003: Standby node time is off by 15 second(s).
--   ------------------------   --------   ---------------   ------   ----------------------------------------------
WARNING    HardwareFailure   Port Index=1   EVT-MPATH-00003: Missing disk connection from system port 6a.
--   ------------------------   --------   ---------------   ------   ----------------------------------------------

 

# ha tila

Aktiivisensolmun ja valmiustilan komennolla #ha voi määrittää nykyisen HA-tilan.
Jos tila on Highly Available, vikasietoisuus on käytössä. 
Jos tila on Degraded tai jokin solmu ei näy online-tilassa, Fail-over solmujen välillä on poissa käytöstä.

 
SE@hostname-p0(active:0)## ha status
HA System name:hostname-n1.chaos.local
HA System status: highly available
 
Node Name                         Node id   Role      HA State
-------------------------------   -------   -------   --------
hostname-p0.chaos.local   0         active    online
hostname-p1.chaos.local   1         standby   online
-------------------------------   -------   -------   --------

# ha tila yksityiskohtainen
Vainaktiivisessa solmussa määritetyllä komennon #ha tilatiedolla voi saada tarkempia tietoja HA:n tilasta.
Mikä tahansa alla olevista lähdöistä, jossa näkyy "ei ok" Peilauksen tila -osassa, tarkoittaa, että osa ei toimi ja HA-järjestelmän tila näkyy heikentyneenä. 
Heikentynyt tila estää solmujen välisen vikasietoisuuden.

Muistiinpano: Tämä komento ei ole käytettävissä valmiustilan solmussa.
 
SEhostname-p0(active:0)## ha status detailed
HA System name: hostname.chaos.local
HA System Status: highly available
Interconnect Status: ok
Primary Heartbeat Status:  ok
External LAN Heartbeat Status: not ok
Hardware compatibility check: ok
Software Version Check:   ok
 
Node hostname-p0.chaos.local:
        Role:      active
        HA State:  online
        Node Health: ok
 
Node hostname-p1.chaos.local:
        Role:     standby
        HA State: online
        Node Health: ok
 
Mirroring Status:
Component Name   Status
--------------   ------
nvram            ok
registry         ok
sms              ok
ddboost          ok
cifs             ok
--------------   ------


# Enclosure Näytä IO-kortit
Varmista, että molemmilla solmuilla on samanlaiset, tuetut kokoonpanot


# kotelo näyttää väärän määrityksen
Tarkista aktiivisten solmujen ja valmiussolmujen määritysvirhetestillä, onko laitteistokokoonpanossa ongelmia. 
Viite tietämyskannan https://www.dell.com/support/kbdoc/en-us/463399


Esimerkkejä: 
Memory DIMMs:
Locator Bank Locator Size(GiB) Status
------- ------------ --------- ----------
CHCD1     7     0     missing
CHDD1     7     0     missing
CHAD0     4     8     wrong size
CHBD0     4     8     wrong size
IO Cards:
Slot   Device       Status
----   ----------   ---------
10     Hera NVRAM   extra
10     Hera NVRAM   misplaced
----   ----------   ---------
CPUs:
    No misconfiguration found.
Disks:
Slot   Size(GiB)   Type   Media   Status
----   ---------   ----   -----   -------
2      186         SATA   SSD     missing
----   ---------   ----   -----   -----
 
# kotelon näyttelytopologia
Tarkista topologia molemmista solmuista. 
Etsi virheitä liitäntäpisteiden välillä ja varmista,
että kaikki hyllynumerointi on oikein.
- Virheitä ja vikoja symboloidaan '?', '!' Tai '!'
Huomautus: Kunkin solmun topologialähtöjen tulisi olla toistensa päinvastaiset (peilikuva).
 
(Stdby:0)## enclosure show topology
Port       enc.ctrl.port       enc.ctrl.port       enc.ctrl.port       enc.ctrl.port
----   -   -------------   -   -------------   -   -------------   -   -------------
2a
2b
2c
2d     >    5.A.E: 5.A.H   ?   4.A.E: 4.A.H   >    3.A.E: 3.A.H   >    2.A.E: 2.A.H
3a
3b
3c
3d
6a     !!    2.B.E: 2.B.H   >    3.B.E: 3.B.H   >    5.B.E: 5.B.H   >    ?.B.E: ?.B.H
6b
6c
6d
----   -   -------------   -   -------------   -   -------------   -   -------------
 
(active:1)## enclosure show topology
Port       enc.ctrl.port       enc.ctrl.port       enc.ctrl.port       enc.ctrl.port
----   -   -------------   -   -------------   -   -------------   -   -------------
2a
2b
2c
2d   >    2.A.H: 2.A.E   >    3.A.H: 3.A.E   >    4.A.H: 4.A.E   >    5.A.H: 5.A.E
3a
3b
3c
3d
6a    >    5.B.H: 5.B.E   >    4.B.H: 4.B.E   >    3.B.H: 3.B.E   >    2.B.H: 2.B.E
6b
6c
6d
----   -   -------------   -   -------------   -   -------------   -   -------------
 
# kotelon testitopologia koko keston ajan 1
Tee 1 minuutin diagnostiikkatesti sekä aktiivisessa että valmiustilassa kaikille SAS HBA -porteille, joihin on liitetty ulkoinen tallennuslaite.
Älä testaa topologiaa molemmissa solmuissa samanaikaisesti. 
Odotettu tulos on, että virheitä ei havaita missään portissa, johon on liitetty tallennustilaa. 
Jos ongelma löytyy, testi voi päättyä virheilmoitukseen, joka ilmaisee SAS-yhteyden vikaan, tai se voi näyttää virheen (? , ! ) tietyssä yhteydessä
.

 
Huomautus: Topologiatestin aikana yksittäisillä porteilla on erillinen lähtö, joka ilmaisee tilan. Etsi virheitä (? , ! ) ongelmayhteyden paikantamiseksiKomentoriviliittymän tulosta ei näytetä ennen kuin kukin porttitesti on valmis. 
 
# enclosure test topology  
Started: 1471719316
Ended: 1471719498
Duration: 182
Port      enc.ctrl.port       enc.ctrl.port       enc.ctrl.port       enc.ctrl.port
----  -  ---------------  -  ---------------  -  ---------------  -  ---------------
2d    >    5.A.H:5.A.E    >    4.A.H:4.A.E    >    3.A.H:3.A.E    >    2.A.H:2.A.E
----  -  ---------------  -  ---------------  -  ---------------  -  ---------------
Error message:
-----------------
No error detected
-----------------

# järjestelmä näyttää NVRAM-muistin
Varmista sekä aktiivisissa solmuissa että valmiustilan solmuissa, että NVRAM-akut ovat ladattuja tai latautuvat ja että kaikkien NVRAM-virhelaskureiden arvo on nolla.
 
# system show nvram
NVRAM Cards:
        Card   Component                 Value
        ----   -----------------------   ----------------------------------------------------------------------
        1      Slot                      0
               Firmware version          0.0.80
               Memory size               7.93 GiB
               Errors                    0 memory (0 uncorrectable), 0 PCI, 0 controller
               Flash controller Errors   0 Cfg Err, 0 PANIC, 0 Bus Hang, 0 Bad Blk Warn, 0 Bkup Err, 0 Rstr Err
               Board temperature         37 C
               CPU temperature           47 C
               Number of batteries       1
        ----   -----------------------   ----------------------------------------------------------------------
NVRAM Batteries:
        Card   Battery   Status   Charge   Charging   Time To       Temperature   Voltage
                                           Status     Full Charge
        ----   -------   ------   ------   --------   -----------   -----------   -------
        1      1         ok       94 %     enabled    0 mins        34 C          4.016 V
        ----   -------   ------   ------   --------   -----------   -----------   -------

Resolution

Jos tarvitset lisäapua, ota yhteyttä sopimuspalveluntarjoajaasi.

Additional Information

.

Affected Products

Data Domain

Products

Data Domain, DD OS 6.0
Article Properties
Article Number: 000017861
Article Type: Solution
Last Modified: 05 Jul 2024
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.