NetWorker: Red Hat -klusterin huolto-ongelman vianmääritysopas

Summary: Tässä artikkelissa on yleiskatsaus siitä, miten lähestytään NetWorker-palvelun käynnistysongelmia NetWorker-palvelimissa, jotka on otettu käyttöön Red Hat pacemaker (pcs) -klustereissa. Tämä artikkeli sopii NetWorker-varmuuskopioinnin järjestelmänvalvojille ja NetWorker-tuelle, jotka auttavat näiden ongelmien vianmäärityksessä. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

NetWorker-palvelimet voidaan ottaa käyttöön klusterin vikasietokokoonpanossa Red Hat -solmuissa sydämentahdistimen avulla (pcs) palvelut. NetWorker on asennettu useisiin solmuihin. Palvelimen tietokannat ovat jaetussa tallennustilassa, joka välitetään solmujen välillä sydämentahdistinkokoonpanon aktiivisen solmun perusteella. NetWorker-palvelin käyttää jaettua klusterin nimeä ja IP-osoitetta, mikä varmistaa yhdenmukaisen nimeämisen ja osoitteen isännöivästä solmusta riippumatta. Katso NetWorker-klusterin integrointioppaasta lisätietoja NetWorkerin määrittämisestä klusterissa. Tämä opas on saatavilla Dellin tuen tuotesivulla

Klusterin topologia:

Artikkelissa käytetään esimerkkiklusteria, jossa on seuraava kokoonpano:
 
NetWorker-klusterin topologia

Isäntänimi
IP-osoite
Toiminto
lnx-node1.amer.lan
192.168.9.108
Fyysinen solmu 1
lnx-node2.amer.lan
192.168.9.109
Fyysinen solmu 2
lnx-nwcluster.amer.lan
192.168.9.110
NetWorkerin käyttämä looginen nimi


Solmujen tiedostojärjestelmä hallinnoi NetWorkeria symbolisten linkkien avulla.

Aktiivinen solmu:

Aktiivinen solmu, jossa NetWorker-palvelin käynnistetään, linkittää symbolisesti /nsr Jaettuun tallennuspaikkaan:
root@lnx-node1:~# ls -l / | grep nsr
lrwxrwxrwx.   1 root root     14 Oct  5 10:49 nsr -> /nsr_share/nsr
drwxr-xr-x.  11 root root    116 Aug 31 17:20 nsr.NetWorker.local
drwxr-xr-x.   3 root root     17 Aug 31 17:23 nsr_share

Passiivinen solmu:

"Passiivinen" solmu linkittää symbolisesti /nsr jotta /nsr.NetWorker.local:
root@lnx-node2:~# ls -l / | grep nsr
lrwxrwxrwx.   1 root root     20 Oct  3 17:08 nsr -> /nsr.NetWorker.local
drwxr-xr-x.  11 root root    116 Aug 31 17:19 nsr.NetWorker.local
drwxr-xr-x.   2 root root      6 Aug 31 17:18 nsr_share

Kun solmu on passiivisessa tilassa, nsrexecd (NetWorker Client) -ohjelmistoa käytetään /nsr.NetWorker.local. Jokaisella fyysisellä solmulla on oma asiakasresurssinsa, joka käyttää fyysisen solmun DNS (Domain Name System) ratkaistavissa olevaa nimeä ja IP-osoitetta. NetWorker-palvelin toimii vain jaetussa tallennustilassa (/nsr_share) ja käyttää jaettua IP-osoitetta ja isäntänimeä. Tämä voi olla aktiivinen vain yhdessä solmussa kerrallaan. 

Seuraava sydämentahdistin (pcs) Komennoilla saadaan yleiskuva sydämentahdistimen asetuksista ja tilasta:

  • Klusterin kokoonpano:

pcs status
Esimerkki:
root@lnx-node1:~# pcs status 
Cluster name: rhelclus 
Status of pacemakerd: 'Pacemaker is running' (last updated 2023-10-05 10:59:19 -04:00) 
Cluster Summary: 
  * Stack: corosync 
  * Current DC: lnx-node1.amer.lan (version 2.1.5-9.3.el8_8-a3f44794f94) - partition with quorum 
  * Last updated: Thu Oct 5 10:59:20 2023 
  * Last change: Thu Oct 5 10:59:13 2023 by root via cibadmin on lnx-node1.amer.lan 
  * 2 nodes configured 
  * 3 resource instances configured 

Node List: 
  * Online: [ lnx-node1.amer.lan lnx-node2.amer.lan ] 

Full List of Resources: 
  * Resource Group: NW_group: 
    * fs (ocf::heartbeat:Filesystem): Started lnx-node1.amer.lan 
    * ip (ocf::heartbeat:IPaddr): Started lnx-node1.amer.lan 
    * nws (ocf::EMC_NetWorker:Server): Started lnx-node1.amer.lan 

Daemon Status: 
  corosync: active/enabled 
  pacemaker: active/enabled 
  pcsd: active/enabled
Edellä esitetystä tuloksesta voidaan päätellä, kuinka monta solmua klusterissa on ja ovatko ne offline- tai valmiustilassa. Tulos näyttää myös, mikä solmu isännöi jaettua tiedostojärjestelmää (fs), klusteriresurssin IP-osoite (ip) ja NetWorker-palvelut (nws). Tässä käytetyt resurssien nimet ovat NetWorker-klusterin integrointioppaassa käytettyjä oletusarvoja. On kuitenkin mahdollista, että käytetään eri nimiä. Jos käytät eri nimiä, kirjoita resurssien nimet muistiin ja korvaa ne tarvittaessa, kun noudatat tämän artikkelin ohjeita.
  • Sydämentahdistimen resurssimääritys:
pcs resource config

Esimerkki:

root@lnx-node1:~# pcs resource config 
Group: NW_group 
  Resource: fs (class=ocf provider=heartbeat type=Filesystem)
    Attributes: fs-instance_attributes 
      device=/dev/sdb1 
      directory=/nsr_share 
      fstype=xfs 
    Operations: 
      monitor: fs-monitor-interval-20 
        interval=20 
        timeout=300 
      start: fs-start-interval-0s 
        interval=0s 
        timeout=60s 
      stop: fs-stop-interval-0s interval=0s timeout=60s 
  Resource: ip (class=ocf provider=heartbeat type=IPaddr) 
    Attributes: ip-instance_attributes 
      cidr_netmask=24 
      ip=192.1xx.9.1x0 
      nic=ens192 
    Operations: 
      monitor: ip-monitor-interval-15 
        interval=15 
        timeout=120 
      start: ip-start-interval-0s 
        interval=0s 
        timeout=20s 
      stop: ip-stop-interval-0s 
        interval=0s 
        timeout=20s 
  Resource: nws (class=ocf provider=EMC_NetWorker type=Server) 
    Meta Attributes: nws-meta_attributes 
      is-managed=true 
    Operations: 
      meta-data: nws-meta-data-interval-0 
        interval=0 
        timeout=10 
      migrate_from: nws-migrate_from-interval-0 
        interval=0 
        timeout=120
      migrate_to: nws-migrate_to-interval-0 
        interval=0 
        timeout=60 
      monitor: nws-monitor-interval-100 
        interval=100 
        timeout=1200 
      start: nws-start-interval-0 
        interval=0 
        timeout=600 
      stop: nws-stop-interval-0 
        interval=0 
        timeout=600 
      validate-all: nws-validate-all-interval-0 
        interval=0 
        timeout=10

 Edellä olevan komennon tiedot kustakin pcs Resurssien määritys. Tärkeitä asioita, jotka on otettava huomioon alustavan yleiskatsauksen aikana:

  • FS-resurssi "device=": Tätä laitetta käytetään solmun tiedostojärjestelmän jaetun tallennustilan liityntäkohtana. Laitteen on oltava sama kaikissa solmuissa. Tätä käsitellään jäljempänä tässä tietämyskannan artikkelissa.
  • FS-resurssi "directory=": Jaettu NetWorker-tallennustila käyttää tätä hakemistoa. Hakemisto on liitettävä "device="-kentän asennuspisteeksi. Tätä käsitellään jäljempänä tässä tietämyskannan artikkelissa.
  • IP-resurssi "ip=": Tämä IP-osoite liittyy NetWorker-palvelimen käyttämään loogiseen (jaettuun) isäntänimeen. Tätä IP-osoitetta isännöidään aktiivisessa solmussa.
  • Sydämentahdistimen näkyvyys jaetusta osoitteesta ja tallennustilasta:
lcmap

Esimerkki:

root@lnx-node1:~# lcmap
type: NSR_CLU_TYPE;
clu_type: NSR_LC_TYPE;
interface version: 1.0;

type: NSR_CLU_VIRTHOST;
hostname: 192.168.9.110;
local: TRUE;
owned paths: /nsr_share;

clu_nodes: lnx-node1.amer.lan lnx-node2.amer.lan;
HUOMAUTUS: Isäntänimen on palautettava IP-osoite, joka vastaa pcs resource config "ip="-kenttä. Omistettujen polkujen on vastattava pcs resource config "hakemisto=" -kenttä. Joissakin tapauksissa, kun havaitaan käynnistysongelma, lcmap komento ei palauta isäntänimen, paikallisten tai omistettujen polkujen kenttiä. Tämä on osoitus ongelmasta.

Alustava diagnoosi:

Jos NetWorker-palvelut eivät käynnisty, tarkista pcs Resurssin tila epäonnistuneen resurssin tarkistamiseksi:

pcs status
Esimerkki: 
root@lnx-node1:~# pcs status 
... 
... 
Node List: 
  * Online: [ lnx-node1.amer.lan lnx-node2.amer.lan ] 

Full List of Resources: 
  * Resource Group: NW_group: 
    * fs    (ocf::heartbeat:Filesystem):   Started lnx-node1.amer.lan 
    * ip    (ocf::heartbeat:IPaddr):       Started lnx-node1.amer.lan 
    * nws   (ocf::EMC_NetWorker:Server):   Started lnx-node1.amer.lan 

Daemon Status: 
  corosync: active/enabled 
  pacemaker: active/enabled 
  pcsd: active/enabled

 Jos virhe havaitaan, palautetaan yleinen virhe. Epäonnistuneiden resurssien tilana näkyy EPÄONNISTUI. 

  • FS (tiedostojärjestelmä): Jos tiedostojärjestelmän tila on epäonnistunut, katso alta kohta Tiedostojärjestelmän virheet.
  • IP (IPaddr): Jos IPaddr on epäonnistuneessa tilassa, katso alla oleva osio IPaddr-virheistä.
  • NWS (palvelin): Jos NetWorker-palvelin on vikatilassa, toimi seuraavasti:
  1. Tarkista NetWorker-palvelimen daemon.raw käynnistyksen aikana ilmeneville virheilmoituksille. Palvelimen /nsr_share/nsr/daemon.raw sijaitsee jaetun tallennustilan polussa. Fyysisten solmujen asiakasohjelman daemon on /nsr.NetWorker.local/logs/daemon.raw. Katso Dellin artikkeli NetWorker: Kuinka käyttää nsr_render_log
  2. Jos oletuslokiin kirjaaminen ei riitä, ota virheenkorjaus käyttöön seuraavasti:
    1. Yritä käynnistää Server-resurssi uudelleen: 
pcs resource cleanup nws
  1. Korosta dbgcommand Ota virheenkorjaus käyttöön kohteessa nsrd prosessi:
dbgcommand -n nsrd Debug=#
Aseta virheenkorjaustaso numeroiden 1–9 avulla. Valvo daemon.raw muut viestit, jotka voivat viitata ongelmaan.
  1. Tutustu /var/log/pcsd/pcsd.log mahdollisten virheiden varalta.
  2. Tutustu /var/log/pacemaker/pacemaker.log mahdollisten virheiden varalta.
  3. Tutustu /var/log/messages Ilmoita mahdolliset virheet.
HUOMAUTUS: Kun tarkastelet pcsd, sydämentahdistin ja viestilokit etsivät viestejä, jotka on kirjattu samoilla aikaleimoilla kuin NetWorker-palvelut yrittivät käynnistyä. Tarkista mahdolliset virheet tai viat, jotka ovat samanaikaisia palvelun käynnistysvirheen kanssa.

Tiedostojärjestelmän viat: 

  1. Tarkista sydämentahdistimen resurssit:
pcs resource
  1. Tarkista Filesystem-resurssin sydämentahdistinresurssin määritys:
pcs resource fs
Esimerkki:
 
Merkitse laitteen polku, hakemistopolku ja fstype muistiin.
root@lnx-node1:~# pcs resource
  * Resource Group: NW_group:
    * fs        (ocf::heartbeat:Filesystem):     Started lnx-node1.amer.lan
    * ip        (ocf::heartbeat:IPaddr):         Started lnx-node1.amer.lan
    * nws       (ocf::EMC_NetWorker:Server):     Started lnx-node1.amer.lan
root@lnx-node1:~# pcs resource config fs
Resource: fs (class=ocf provider=heartbeat type=Filesystem)
  Attributes: fs-instance_attributes
    device=/dev/sdb1
    directory=/nsr_share
    fstype=xfs
  Operations:
    monitor: fs-monitor-interval-20
      interval=20
      timeout=300
    start: fs-start-interval-0s
      interval=0s
      timeout=60s
    stop: fs-stop-interval-0s
      interval=0s
      timeout=60s
  1. Varmista, onko laite asennettu FS: ään:
df -h

Esimerkki:

root@lnx-node1:~# df -h | grep /nsr_share /dev/sdb1                                     94G  1.5G   92G   2% /nsr_share
  1. Tarkista, onko asennuspiste määritetty oikein; Laitteen liittäminen polkuun:
lsblk

Esimerkki:

root@lnx-node1:~# lsblk
NAME          MAJ:MIN RM  SIZE RO TYPE MOUNTPOINT
sda             8:0    0   40G  0 disk
├─sda1          8:1    0  600M  0 part /boot/efi
├─sda2          8:2    0    1G  0 part /boot
└─sda3          8:3    0 38.4G  0 part
  ├─rhel-root 253:0    0 34.4G  0 lvm  /
  └─rhel-swap 253:1    0    4G  0 lvm  [SWAP]
sdb             8:16   0  100G  0 disk
└─sdb1          8:17   0 93.1G  0 part /nsr_share
sr0            11:0    1 1024M  0 rom
  1. Varmista, että laitteen käyttämä tiedostojärjestelmä on oikea:
blkid
Esimerkki:
root@lnx-node1:~# blkid 
/dev/mapper/rhel-root: UUID="7cf2f957-18d8-45b8-bf8f-6361aadc3517" BLOCK_SIZE="512" TYPE="xfs" 
/dev/sda3: UUID="QpZ2hK-OuE2-igN0-Ryba-EwMN-uxq1-LE48hD" TYPE="LVM2_member" PARTUUID="1193db91-4b63-4b33-a4d4-03a22317e064" 
/dev/sda1: UUID="F243-AD41" BLOCK_SIZE="512" TYPE="vfat" PARTLABEL="EFI System Partition" PARTUUID="6c81bd63-0249-4bdf-afdb-cdde72034162" 
/dev/sda2: UUID="7677ad6b-8191-4a45-8a8a-16cf7d00d72c" BLOCK_SIZE="512" TYPE="xfs" PARTUUID="57481b7a-83ec-4cd8-bf2d-bca09ac27040" 
/dev/sdb1: UUID="600bca60-dd5d-4162-bf77-0537daa3b1e5" BLOCK_SIZE="512" TYPE="xfs" PARTLABEL="networker" PARTUUID="769aaac2-764b-431d-be21-3b5753d6a5d3" 
/dev/mapper/rhel-swap: UUID="537962b6-07d4-4a40-9687-deab2e488936" TYPE="swap"
Jos fs (Filesystem) -resurssi ei käynnisty. Tämä on merkki NetWorkerin ulkopuolisesta ongelmasta. Järjestelmänvalvojan on tarkistettava klusterin tiedostojärjestelmän määritykset ja varmistettava, että sydämentahdistimen käyttämässä jaetussa tallennustilassa ei ole ongelmia. Tarkista järjestelmän tai sen laitteiden vikoja koskevat muut järjestelmälokit: 
  • /var/log/pcsd/pcsd.log 
  • /var/log/pacemaker/pacemaker.log
  • /var/log/messages

IPaddr-viat:

  1. Tarkista sydämentahdistimen resurssit:
pcs resource
  1. Tarkista Filesystem-resurssin sydämentahdistinresurssin määritys:
pcs resource config ip
Esimerkki:
 
Merkitse muistiin IP-osoite ja verkkokortti (NIC).
root@lnx-node1:~# pcs resource
  * Resource Group: NW_group:
    * fs (ocf::heartbeat:Filesystem): Started lnx-node1.amer.lan
    * ip (ocf::heartbeat:IPaddr): Started lnx-node1.amer.lan
    * nws (ocf::EMC_NetWorker:Server): Started lnx-node1.amer.lan
root@lnx-node1:~# pcs resource config ip
Resource: ip (class=ocf provider=heartbeat type=IPaddr)
  Attributes: ip-instance_attributes
    cidr_netmask=24
    ip=192.1xx.9.1x0
    nic=ens192
  Operations:
    monitor: ip-monitor-interval-15
      interval=15
      timeout=120
    start: ip-start-interval-0s
      interval=0s
      timeout=20s stop:
    ip-stop-interval-0s
      interval=0s
      timeout=20s
  1. Tarkista, onko verkkokortti käytettävissä järjestelmässä:
ifconfig -a
Esimerkki: 
root@lnx-node1:~# ifconfig -a 
ens192: flags=4163<UP,BROADCAST,RUNNING,MULTICAST> mtu 1500
        inet 192.1xx.9.1x8 netmask 255.255.255.0 broadcast 192.1xx.9.255
        inet6 fe80::250:56ff:fea5:48e1 prefixlen 64 scopeid 0x20<link>
        ether 00:50:56:a5:48:e1 txqueuelen 1000 (Ethernet)
        RX packets 953865 bytes 349705527 (333.5 MiB)
        RX errors 0 dropped 0 overruns 0 frame 0
        TX packets 1190983 bytes 179749786 (171.4 MiB)
        TX errors 0 dropped 0 overruns 0 carrier 0 collisions 0 
lo: flags=73<UP,LOOPBACK,RUNNING> mtu 65536
        inet 127.0.0.1 netmask 255.0.0.0 
        inet6 ::1 prefixlen 128 scopeid 0x10<host>
        loop txqueuelen 1000 (Local Loopback)
        RX packets 129798 bytes 13274289 (12.6 MiB)
        RX errors 0 dropped 0 overruns 0 frame 0 
        TX packets 129798 bytes 13274289 (12.6 MiB) 
        TX errors 0 dropped 0 overruns 0 carrier 0 collisions 0
IP-osoite, joka näkyy kohdassa ifconfig vastaa fyysisen solmun nimeä; Klusteroitu IP-osoite on kuitenkin tavoitettavissa tämän verkkokortin kautta, kun solmu on aktiivinen. Varmista, että molemmat solmut on määritetty käyttämään samoja verkkokorttinimiä.
  1. Palautuuko IP-osoite oikeaan (loogiseen) isäntänimeen, jota NetWorker-palvelin käyttää?
nslookup ip 

nslookup logical_name_FQDN 

nslookup logical_name_short
Esimerkki:
root@lnx-node1:~# nslookup 192.1xx.9.1x0 
110.9.1xx.1x2.in-addr.arpa name = lnx-nwcluster.amer.lan. 

root@lnx-node1:~# nslookup lnx-nwcluster.amer.lan. 
Server: 192.1xx.9.1x0 
Address: 192.1xx.9.100#53 

Name: lnx-nwcluster.amer.lan 
Address: 192.1xx.9.1x0 

root@lnx-node1:~# nslookup lnx-nwcluster 
Server: 192.1xx.9.1x0 
Address: 192.1xx.9.100#53 

Name: lnx-nwcluster.amer.lan 
Address: 192.1xx.9.1x0

Suosittelemme tekemään samat vaiheet myös fyysisen solmun IP-osoitteelle, FQDN:lle ja lyhytnimelle. Katso Dellin artikkeli NetWorker: Nimenselvityksen parhaat vianmäärityskäytännöt.

  1. Voiko klusterin IP-osoitteeseen saada yhteyden seuraavanlaisella tavalla? ping?
ping -c 4 ip
Esimerkki:
root@lnx-node1:~# ping -c 4 192.1xx8.9.1x0 
PING 192.1xx8.9.1x0 (192.1xx.9.1x0) 56(84) bytes of data. 
64 bytes from 192.1xx.9.1x0: icmp_seq=1 ttl=64 time=0.051 ms 
64 bytes from 192.1xx.9.1x0: icmp_seq=2 ttl=64 time=0.043 ms 
64 bytes from 192.1xx.9.1x0: icmp_seq=3 ttl=64 time=0.033 ms 
64 bytes from 192.1xx.9.1x0: icmp_seq=4 ttl=64 time=0.034 ms 

--- 192.1xx.9.1x0 ping statistics --- 4 packets transmitted, 
4 received, 0% packet loss, time 3108ms rtt min/avg/max/mdev = 0.033/0.040/0.051/0.008 ms
Jos IP (IPaddr) -resurssi ei käynnisty. Tämä on merkki NetWorkerin ulkopuolisesta ongelmasta. Klusterin järjestelmänvalvojan ja verkonvalvojan on tarkistettava klusterin verkkomääritykset ja varmistettava, ettei ongelmia ole havaittu. Tarkista järjestelmän tai sen laitteiden vikoja koskevat muut järjestelmälokit:
  • /var/log/pcsd/pcsd.log 
  • /var/log/pacemaker/pacemaker.log
  • /var/log/messages

Muut PCS-komennot:

Operaatio Komento
sydämentahdistin tai pcs version:
pcs --version
Sydämentahdistimen yleiskatsaus
pcs status
Sydämentahdistimen resurssien yleiskatsaus
pcs resource
Määritä polun omistajuus klusterissa.
lcmap
Ota käyttöön (käynnistä) resurssi.
pcs resource enable resource_name
Käynnistä pcs resurssi virheenkorjauksella.
pcs resource debug-start resource_name 
Tietokoneen resurssien määritysasetusten tarkistaminen
pcs resource config resource_name
Poista käytöstä (pysäytä) resurssi:
pcs resource disable resource_name  
Käynnistä uudelleen epäonnistunut resurssi.
pcs resource cleanup resource_name
Pysäytä sydämentahdistin solmussa.
pcs stop cluster [--force]
Käynnistä sydämentahdistin
pcs cluster start [--all]
Aseta solmu valmiustilaan.
pcs node standby node_name
Siirrä solmu pois valmiustilasta. 
pcs node unstandby node_name

Tärkeät lokit ja tiedostot:

Polku Tarkoitus Lisäkomennot
/var/log/messages Sisältää järjestelmän resursseja ja palveluita koskevia yleisiä järjestelmäviestejä.
grep 'pacemaker.*\(error\|warning\)' /var/log/messages
/var/log/pacemaker/pacemaker.log  Sydämentahdistimen oletustietojen kirjaaminen sydämentahdistimen resursseille ja toiminnoille.
/var/log/pcsd/pcsd.log Sydämentahdistimen oletuspalvelu/daemon (pcsd) loki. 
/var/log/cluster/corosync.log Sydämentahdistimen solmun oletusarvoinen tiedonsiirtoloki. 
/usr/sbin/nw_hae.log NetWorker (nws) resurssin aloitusloki kohdassa /usr/lib/ocf/resource.d/EMC_NetWorker/Server
/usr/lib/ocf/resource.d/EMC_NetWorker/Server  NetWorker-sydämentahdistimen määritystiedosto. Tätä toimintoja suorittavat / hallitsevat tietokoneet.

Affected Products

NetWorker

Products

NetWorker Family, NetWorker Series
Article Properties
Article Number: 000218281
Article Type: How To
Last Modified: 22 Oct 2025
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.