NetWorker: Red Hat Küme Hizmeti Sorunu İçin Sorun Giderme Kılavuzu

Summary: Bu makale, Red Hat pacemaker (pcs) kümelerinde dağıtılan NetWorker sunucuları için NetWorker hizmeti başlatma sorunlarına yönelik genel bir bakış sağlar. Bu makale, bu sorunları gidermeye yardımcı olmak amacıyla NetWorker yedek yöneticileri ve NetWorker desteği için uygundur. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

NetWorker sunucuları, pacemaker (pcs) hizmetleri. NetWorker birden fazla düğüme kurulur. Sunucu veritabanları, paylaşılan depolamadadır ve kalp pili yapılandırmasındaki etkin düğüme bağlı olarak düğümler arasında aktarılır. NetWorker sunucusu, paylaşılan bir küme adı ve IP adresi kullanır ve barındırma düğümünden bağımsız olarak tutarlı adlandırma ve adresleme sağlar. Bir kümede NetWorker kurulumuyla ilgili ayrıntılar için NetWorker Küme Entegrasyon Rehberine bakın. Bu kılavuz, Dell Desteği Ürün Sayfasında mevcuttur. 

Küme Topolojisi:

Bu makalede, aşağıdaki yapılandırmaya sahip örnek bir küme kullanılmaktadır:
 
NetWorker Küme Topolojisi

Ana bilgisayar adı
IP Adresi
İşlev
lnx-node1.amer.lan
192.168.9.108
Fiziksel Düğüm 1
lnx-node2.amer.lan
192.168.9.109
Fiziksel Düğüm 2
lnx-nwcluster.amer.lan
192.168.9.110
NetWorker tarafından kullanılan Mantıksal Ad


Düğümlerdeki dosya sistemi, NetWorker'ı sembolik bağlantılar kullanarak yönetir.

Aktif Düğüm:

NetWorker sunucusunun başlatıldığı etkin bir düğüm sembolik olarak bağlanır /nsr Paylaşılan depolama konumuna:
root@lnx-node1:~# ls -l / | grep nsr
lrwxrwxrwx.   1 root root     14 Oct  5 10:49 nsr -> /nsr_share/nsr
drwxr-xr-x.  11 root root    116 Aug 31 17:20 nsr.NetWorker.local
drwxr-xr-x.   3 root root     17 Aug 31 17:23 nsr_share

Pasif Düğüm:

"Pasif" bir düğüm sembolik olarak bağlanır /nsr özniteliğinin değerini /nsr.NetWorker.local:
root@lnx-node2:~# ls -l / | grep nsr
lrwxrwxrwx.   1 root root     20 Oct  3 17:08 nsr -> /nsr.NetWorker.local
drwxr-xr-x.  11 root root    116 Aug 31 17:19 nsr.NetWorker.local
drwxr-xr-x.   2 root root      6 Aug 31 17:18 nsr_share

Bir düğüm pasif durumdayken nsrexecd (NetWorker istemcisi) yazılımı kullanarak çalışıyor /nsr.NetWorker.local. Her fiziksel düğümün, Etki Alanı Adı Sistemi (DNS) çözümlenebilir adını ve IP adresini kullanan kendi istemci kaynağı vardır. NetWorker sunucusu yalnızca paylaşılan depolamayı (/nsr_share) ve paylaşılan IP adresini ve ana bilgisayar adını kullanır. Bu, aynı anda yalnızca bir düğümde etkin olabilir. 

Aşağıdaki kalp pili (pcs) komutları, kalp pili yapılandırmasına ve durumuna genel bir bakış elde etmek için kullanılır:

  • Küme yapılandırması:

pcs status
Örneğin:
root@lnx-node1:~# pcs status 
Cluster name: rhelclus 
Status of pacemakerd: 'Pacemaker is running' (last updated 2023-10-05 10:59:19 -04:00) 
Cluster Summary: 
  * Stack: corosync 
  * Current DC: lnx-node1.amer.lan (version 2.1.5-9.3.el8_8-a3f44794f94) - partition with quorum 
  * Last updated: Thu Oct 5 10:59:20 2023 
  * Last change: Thu Oct 5 10:59:13 2023 by root via cibadmin on lnx-node1.amer.lan 
  * 2 nodes configured 
  * 3 resource instances configured 

Node List: 
  * Online: [ lnx-node1.amer.lan lnx-node2.amer.lan ] 

Full List of Resources: 
  * Resource Group: NW_group: 
    * fs (ocf::heartbeat:Filesystem): Started lnx-node1.amer.lan 
    * ip (ocf::heartbeat:IPaddr): Started lnx-node1.amer.lan 
    * nws (ocf::EMC_NetWorker:Server): Started lnx-node1.amer.lan 

Daemon Status: 
  corosync: active/enabled 
  pacemaker: active/enabled 
  pcsd: active/enabled
Yukarıdaki çıktıdan, kümede kaç düğüm olduğunu ve bunların çevrimdışı veya bekleme durumunda olup olmadığını belirleyebiliriz. Çıktı ayrıca paylaşılan dosya sistemini barındıran düğümü de gösterir (fs), küme kaynağı IP adresi (ip) ve NetWorker hizmetleri (nws). Burada kullanılan kaynak adları, NetWorker Küme Entegrasyon Rehberi'nde kullanılan varsayılanlardır; Ancak, farklı isimlerin kullanılması mümkündür. Farklı adlar kullanıyorsanız, kaynak adlarını not edin ve bu makaledeki yönergeleri izlerken gerektiği gibi değiştirin.
  • Pacemaker kaynak yapılandırması:
pcs resource config

Örneğin:

root@lnx-node1:~# pcs resource config 
Group: NW_group 
  Resource: fs (class=ocf provider=heartbeat type=Filesystem)
    Attributes: fs-instance_attributes 
      device=/dev/sdb1 
      directory=/nsr_share 
      fstype=xfs 
    Operations: 
      monitor: fs-monitor-interval-20 
        interval=20 
        timeout=300 
      start: fs-start-interval-0s 
        interval=0s 
        timeout=60s 
      stop: fs-stop-interval-0s interval=0s timeout=60s 
  Resource: ip (class=ocf provider=heartbeat type=IPaddr) 
    Attributes: ip-instance_attributes 
      cidr_netmask=24 
      ip=192.1xx.9.1x0 
      nic=ens192 
    Operations: 
      monitor: ip-monitor-interval-15 
        interval=15 
        timeout=120 
      start: ip-start-interval-0s 
        interval=0s 
        timeout=20s 
      stop: ip-stop-interval-0s 
        interval=0s 
        timeout=20s 
  Resource: nws (class=ocf provider=EMC_NetWorker type=Server) 
    Meta Attributes: nws-meta_attributes 
      is-managed=true 
    Operations: 
      meta-data: nws-meta-data-interval-0 
        interval=0 
        timeout=10 
      migrate_from: nws-migrate_from-interval-0 
        interval=0 
        timeout=120
      migrate_to: nws-migrate_to-interval-0 
        interval=0 
        timeout=60 
      monitor: nws-monitor-interval-100 
        interval=100 
        timeout=1200 
      start: nws-start-interval-0 
        interval=0 
        timeout=600 
      stop: nws-stop-interval-0 
        interval=0 
        timeout=600 
      validate-all: nws-validate-all-interval-0 
        interval=0 
        timeout=10

 Yukarıdaki komut, her birini ayrıntılı olarak açıklar pcs Kaynak yapılandırması. İlk genel bakış sırasında dikkat edilmesi gereken önemli noktalar:

  • FS kaynağı "device=": Bu, düğüm dosya sistemindeki paylaşılmış depolama için bağlantı noktası olarak kullanılan aygıttır. Bu aygıt her düğümde aynı olmalıdır. Bu konu daha sonra bu KB de ele alınacaktır.
  • FS resource "directory=": Bu, paylaşılan NetWorker depolamasının kullandığı dizindir. Dizin, "device=" alanı için bağlantı noktası olarak ilişkilendirilmelidir. Bu konu daha sonra bu KB de ele alınacaktır.
  • IP kaynağı "ip=": Bu, NetWorker sunucusu tarafından kullanılan mantıksal (paylaşılan) ana bilgisayar adı ile ilişkili IP adresidir. Bu IP adresi aktif düğümde barındırılır.
  • Paylaşılan adresin ve depolamanın pacemaker görünürlüğü:
lcmap

Örneğin:

root@lnx-node1:~# lcmap
type: NSR_CLU_TYPE;
clu_type: NSR_LC_TYPE;
interface version: 1.0;

type: NSR_CLU_VIRTHOST;
hostname: 192.168.9.110;
local: TRUE;
owned paths: /nsr_share;

clu_nodes: lnx-node1.amer.lan lnx-node2.amer.lan;
NOT: Ana bilgisayar adı, kümeden eşleşen IP adresini döndürmelidir. pcs resource config "ip=" alanı. Sahip olunan yollar pcs resource config "directory=" alanı. Bazı durumlarda, bir başlatma sorunu gözlemlendiğinde, lcmap Komut, ana bilgisayar adı, yerel veya sahip olunan yollar alanlarını döndürmez; Bu, bir sorunun göstergesidir.

İlk Teşhis:

NetWorker hizmetleri başlatılamıyorsa pcs Hangi kaynağın arızalı olduğunu görmek için Kaynak durumu:

pcs status
Örneğin: 
root@lnx-node1:~# pcs status 
... 
... 
Node List: 
  * Online: [ lnx-node1.amer.lan lnx-node2.amer.lan ] 

Full List of Resources: 
  * Resource Group: NW_group: 
    * fs    (ocf::heartbeat:Filesystem):   Started lnx-node1.amer.lan 
    * ip    (ocf::heartbeat:IPaddr):       Started lnx-node1.amer.lan 
    * nws   (ocf::EMC_NetWorker:Server):   Started lnx-node1.amer.lan 

Daemon Status: 
  corosync: active/enabled 
  pacemaker: active/enabled 
  pcsd: active/enabled

 Bir hata gözlemlenirse, döndürülen genel bir hata hatası vardır. Başarısız olan kaynaklar BAŞARISIZ olarak gösterilir. 

  • FS (Dosya Sistemi): Dosya sistemi başarısız durumdaysa aşağıdaki Dosya Sistemi Arızaları bölümüne bakın.
  • IP (IPaddr): IPaddr başarısız durumdaysa, IPaddr Hataları ile ilgili aşağıdaki bölüme bakın.
  • NWS (Sunucu): NetWorker sunucusu arızalı durumdaysa aşağıdakileri yapın:
  1. NetWorker sunucusunun daemon.raw başlatma sırasında görünen herhangi bir hata mesajı için. Sunucunun /nsr_share/nsr/daemon.raw paylaşılan depolama yolunda bulunur. İstemci daemon'ının içinde bulunduğu fiziksel düğümler /nsr.NetWorker.local/logs/daemon.rawNetWorker: şu Dell makalesine bakın: nsr_render_log'u kullanma
  2. Varsayılan günlük yeterli değilse aşağıdakileri yaparak hata ayıklamayı etkinleştirin:
    1. Server" kaynağını yeniden başlatmayı deneyin: 
pcs resource cleanup nws
  1. Video (Video) öğesini vurgulamak için dbgcommand Hata ayıklamayı etkinleştirmek için nsrd işlem:
dbgcommand -n nsrd Debug=#
1'den 9'a kadar sayıları kullanarak bir hata ayıklama düzeyi ayarlayın. Şunu izleyin: daemon.raw bir soruna yönlendirebilecek herhangi bir ek mesaj için.
  1. Şunu inceleyin: /var/log/pcsd/pcsd.log herhangi bir hata için.
  2. Şunu inceleyin: /var/log/pacemaker/pacemaker.log herhangi bir hata için.
  3. Şunu inceleyin: /var/log/messages herhangi bir hata için dosya.
NOT: Gözden geçirirken pcsd, pacemaker ve mesaj günlükleri, NetWorker hizmetlerinin başlatılmaya çalışıldığı zaman damgaları sırasında günlüğe kaydedilen mesajları arar. Hizmet başlatma hatasıyla çakışan hataları veya arızaları inceleyin.

Dosya Sistemi Arızaları: 

  1. Kalp pili kaynaklarını inceleyin:
pcs resource
  1. Filesystem kaynağı için pacemaker kaynak yapılandırmasını gözden geçirin:
pcs resource fs
Örneğin:
 
Aygıt yolunu, dizin yolunu ve fstype'ı not edin.
root@lnx-node1:~# pcs resource
  * Resource Group: NW_group:
    * fs        (ocf::heartbeat:Filesystem):     Started lnx-node1.amer.lan
    * ip        (ocf::heartbeat:IPaddr):         Started lnx-node1.amer.lan
    * nws       (ocf::EMC_NetWorker:Server):     Started lnx-node1.amer.lan
root@lnx-node1:~# pcs resource config fs
Resource: fs (class=ocf provider=heartbeat type=Filesystem)
  Attributes: fs-instance_attributes
    device=/dev/sdb1
    directory=/nsr_share
    fstype=xfs
  Operations:
    monitor: fs-monitor-interval-20
      interval=20
      timeout=300
    start: fs-start-interval-0s
      interval=0s
      timeout=60s
    stop: fs-stop-interval-0s
      interval=0s
      timeout=60s
  1. Aygıtın FS ye takılı olup olmadığını doğrulayın:
df -h

Örneğin:

root@lnx-node1:~# df -h | grep /nsr_share /dev/sdb1                                     94G  1.5G   92G   2% /nsr_share
  1. Bağlantı noktasının doğru yapılandırılıp yapılandırılmadığını onaylayın; Cihazı yol ile ilişkilendirme:
lsblk

Örneğin:

root@lnx-node1:~# lsblk
NAME          MAJ:MIN RM  SIZE RO TYPE MOUNTPOINT
sda             8:0    0   40G  0 disk
├─sda1          8:1    0  600M  0 part /boot/efi
├─sda2          8:2    0    1G  0 part /boot
└─sda3          8:3    0 38.4G  0 part
  ├─rhel-root 253:0    0 34.4G  0 lvm  /
  └─rhel-swap 253:1    0    4G  0 lvm  [SWAP]
sdb             8:16   0  100G  0 disk
└─sdb1          8:17   0 93.1G  0 part /nsr_share
sr0            11:0    1 1024M  0 rom
  1. Cihaz tarafından kullanılan dosya sisteminin doğru olduğunu onaylayın:
blkid
Örneğin:
root@lnx-node1:~# blkid 
/dev/mapper/rhel-root: UUID="7cf2f957-18d8-45b8-bf8f-6361aadc3517" BLOCK_SIZE="512" TYPE="xfs" 
/dev/sda3: UUID="QpZ2hK-OuE2-igN0-Ryba-EwMN-uxq1-LE48hD" TYPE="LVM2_member" PARTUUID="1193db91-4b63-4b33-a4d4-03a22317e064" 
/dev/sda1: UUID="F243-AD41" BLOCK_SIZE="512" TYPE="vfat" PARTLABEL="EFI System Partition" PARTUUID="6c81bd63-0249-4bdf-afdb-cdde72034162" 
/dev/sda2: UUID="7677ad6b-8191-4a45-8a8a-16cf7d00d72c" BLOCK_SIZE="512" TYPE="xfs" PARTUUID="57481b7a-83ec-4cd8-bf2d-bca09ac27040" 
/dev/sdb1: UUID="600bca60-dd5d-4162-bf77-0537daa3b1e5" BLOCK_SIZE="512" TYPE="xfs" PARTLABEL="networker" PARTUUID="769aaac2-764b-431d-be21-3b5753d6a5d3" 
/dev/mapper/rhel-swap: UUID="537962b6-07d4-4a40-9687-deab2e488936" TYPE="swap"
fs (Filesystem) kaynağı başlatılamıyorsa. Bu, NetWorker dışındaki bir soruna işaret eder. Sistem yöneticisi, kümenin dosya sistemi yapılandırmasını gözden geçirmeli ve pacemaker tarafından kullanılan paylaşılmış depolamayla ilgili herhangi bir sorun olmadığını onaylamalıdır. Sistem veya aygıtlarıyla ilgili arızalarla ilgili ek sistem günlüklerini gözden geçirin: 
  • /var/log/pcsd/pcsd.log 
  • /var/log/pacemaker/pacemaker.log
  • /var/log/messages

IPaddr Hataları:

  1. Kalp pili kaynaklarını inceleyin:
pcs resource
  1. Filesystem kaynağı için pacemaker kaynak yapılandırmasını gözden geçirin:
pcs resource config ip
Örneğin:
 
IP adresini ve Ağ Arayüzü Kartını (NIC) not edin.
root@lnx-node1:~# pcs resource
  * Resource Group: NW_group:
    * fs (ocf::heartbeat:Filesystem): Started lnx-node1.amer.lan
    * ip (ocf::heartbeat:IPaddr): Started lnx-node1.amer.lan
    * nws (ocf::EMC_NetWorker:Server): Started lnx-node1.amer.lan
root@lnx-node1:~# pcs resource config ip
Resource: ip (class=ocf provider=heartbeat type=IPaddr)
  Attributes: ip-instance_attributes
    cidr_netmask=24
    ip=192.1xx.9.1x0
    nic=ens192
  Operations:
    monitor: ip-monitor-interval-15
      interval=15
      timeout=120
    start: ip-start-interval-0s
      interval=0s
      timeout=20s stop:
    ip-stop-interval-0s
      interval=0s
      timeout=20s
  1. NIC'nin sistemde mevcut olup olmadığını onaylayın:
ifconfig -a
Örneğin: 
root@lnx-node1:~# ifconfig -a 
ens192: flags=4163<UP,BROADCAST,RUNNING,MULTICAST> mtu 1500
        inet 192.1xx.9.1x8 netmask 255.255.255.0 broadcast 192.1xx.9.255
        inet6 fe80::250:56ff:fea5:48e1 prefixlen 64 scopeid 0x20<link>
        ether 00:50:56:a5:48:e1 txqueuelen 1000 (Ethernet)
        RX packets 953865 bytes 349705527 (333.5 MiB)
        RX errors 0 dropped 0 overruns 0 frame 0
        TX packets 1190983 bytes 179749786 (171.4 MiB)
        TX errors 0 dropped 0 overruns 0 carrier 0 collisions 0 
lo: flags=73<UP,LOOPBACK,RUNNING> mtu 65536
        inet 127.0.0.1 netmask 255.0.0.0 
        inet6 ::1 prefixlen 128 scopeid 0x10<host>
        loop txqueuelen 1000 (Local Loopback)
        RX packets 129798 bytes 13274289 (12.6 MiB)
        RX errors 0 dropped 0 overruns 0 frame 0 
        TX packets 129798 bytes 13274289 (12.6 MiB) 
        TX errors 0 dropped 0 overruns 0 carrier 0 collisions 0
Şu şekilde gösterilir: ifconfig fiziksel düğüm adıyla eşleşir; ancak düğüm etkin olduğunda kümelenmiş IP'ye bu NIC üzerinden erişilebilir. Her iki düğümün de aynı NIC adlarını kullanacak şekilde yapılandırıldığından emin olun.
  1. IP adresi, NetWorker sunucusu tarafından kullanılan doğru (mantıksal) ana bilgisayar adına çözümleniyor mu?
nslookup ip 

nslookup logical_name_FQDN 

nslookup logical_name_short
Örneğin:
root@lnx-node1:~# nslookup 192.1xx.9.1x0 
110.9.1xx.1x2.in-addr.arpa name = lnx-nwcluster.amer.lan. 

root@lnx-node1:~# nslookup lnx-nwcluster.amer.lan. 
Server: 192.1xx.9.1x0 
Address: 192.1xx.9.100#53 

Name: lnx-nwcluster.amer.lan 
Address: 192.1xx.9.1x0 

root@lnx-node1:~# nslookup lnx-nwcluster 
Server: 192.1xx.9.1x0 
Address: 192.1xx.9.100#53 

Name: lnx-nwcluster.amer.lan 
Address: 192.1xx.9.1x0

Aynı adımların fiziksel düğümün IP adresi, FQDN ve kısa adı için de uygulanması önerilir. NetWorker: şu Dell makalesine bakın: Ad Çözümlemesi Sorun Giderme En İyi Yöntemleri.

  1. Şunu kullanarak küme IP adresine ulaşabiliyor musunuz? ping?
ping -c 4 ip
Örneğin:
root@lnx-node1:~# ping -c 4 192.1xx8.9.1x0 
PING 192.1xx8.9.1x0 (192.1xx.9.1x0) 56(84) bytes of data. 
64 bytes from 192.1xx.9.1x0: icmp_seq=1 ttl=64 time=0.051 ms 
64 bytes from 192.1xx.9.1x0: icmp_seq=2 ttl=64 time=0.043 ms 
64 bytes from 192.1xx.9.1x0: icmp_seq=3 ttl=64 time=0.033 ms 
64 bytes from 192.1xx.9.1x0: icmp_seq=4 ttl=64 time=0.034 ms 

--- 192.1xx.9.1x0 ping statistics --- 4 packets transmitted, 
4 received, 0% packet loss, time 3108ms rtt min/avg/max/mdev = 0.033/0.040/0.051/0.008 ms
IP (IPaddr) kaynağı başlatılamıyorsa. Bu, NetWorker dışındaki bir soruna işaret eder. Kümenin sistem yöneticisi ve ağ yöneticisi, kümenin ağ yapılandırmasını gözden geçirmek ve herhangi bir sorun gözlemlenmediğini onaylamak için devreye girmelidir. Sistem veya aygıtlarıyla ilgili arızalarla ilgili ek sistem günlüklerini gözden geçirin:
  • /var/log/pcsd/pcsd.log 
  • /var/log/pacemaker/pacemaker.log
  • /var/log/messages

Diğer PCS Komutları:

İşlem Komut
Kalp pili veya pcs version:
pcs --version
Pacemaker'a Genel Bakış
pcs status
Pacemaker kaynağına genel bakış
pcs resource
Bir kümedeki yol sahipliğini belirleyin.
lcmap
Kaynağı etkinleştirme (başlatma).
pcs resource enable resource_name
Başlat pcs hata ayıklamalı kaynak.
pcs resource debug-start resource_name 
Bilgisayarların kaynak yapılandırma ayarlarını gözden geçirme
pcs resource config resource_name
Kaynağı devre dışı bırakma (durdurma):
pcs resource disable resource_name  
Yeniden başlatma işlemi başarısız olan kaynak.
pcs resource cleanup resource_name
Düğümde kalp pilini durdurun.
pcs stop cluster [--force]
Kalp pilini başlat
pcs cluster start [--all]
Düğümü bekleme moduna alın.
pcs node standby node_name
Düğümü bekleme modundan çıkarın. 
pcs node unstandby node_name

Önemli Günlükler ve Dosyalar:

Yol Amaç Tamamlayıcı Komutlar
/var/log/messages Sistem kaynakları ve hizmetleriyle ilgili genel sistem mesajlarını içerir.
grep 'pacemaker.*\(error\|warning\)' /var/log/messages
/var/log/pacemaker/pacemaker.log  Kalp pili kaynakları ve işlevleri için varsayılan kalp pili bilgileri günlüğü. Yok
/var/log/pcsd/pcsd.log Varsayılan kalp pili hizmeti/geriplanı (pcsd) günlüğü.  Yok
/var/log/cluster/corosync.log Varsayılan kalp pili düğümü iletişim günlüğü.  Yok
/usr/sbin/nw_hae.log NetWorker (nws) içinde tanımlandığı şekilde kaynak başlatma günlüğü /usr/lib/ocf/resource.d/EMC_NetWorker/Server Yok
/usr/lib/ocf/resource.d/EMC_NetWorker/Server  NetWorker pacemaker yapılandırma dosyası. Bu, pc'ler tarafından gerçekleştirilen/yönetilen işlemlerdir. Yok

Affected Products

NetWorker

Products

NetWorker Family, NetWorker Series
Article Properties
Article Number: 000218281
Article Type: How To
Last Modified: 22 Oct 2025
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.