NetWorker: Red Hat Küme Hizmeti Sorunu İçin Sorun Giderme Kılavuzu
Summary: Bu makale, Red Hat pacemaker (pcs) kümelerinde dağıtılan NetWorker sunucuları için NetWorker hizmeti başlatma sorunlarına yönelik genel bir bakış sağlar. Bu makale, bu sorunları gidermeye yardımcı olmak amacıyla NetWorker yedek yöneticileri ve NetWorker desteği için uygundur. ...
Instructions
NetWorker sunucuları, pacemaker (pcs) hizmetleri. NetWorker birden fazla düğüme kurulur. Sunucu veritabanları, paylaşılan depolamadadır ve kalp pili yapılandırmasındaki etkin düğüme bağlı olarak düğümler arasında aktarılır. NetWorker sunucusu, paylaşılan bir küme adı ve IP adresi kullanır ve barındırma düğümünden bağımsız olarak tutarlı adlandırma ve adresleme sağlar. Bir kümede NetWorker kurulumuyla ilgili ayrıntılar için NetWorker Küme Entegrasyon Rehberine bakın. Bu kılavuz, Dell Desteği Ürün Sayfasında mevcuttur.
Küme Topolojisi:
Bu makalede, aşağıdaki yapılandırmaya sahip örnek bir küme kullanılmaktadır:
NetWorker Küme Topolojisi
|
Ana bilgisayar adı
|
IP Adresi
|
İşlev
|
|
lnx-node1.amer.lan
|
192.168.9.108
|
Fiziksel Düğüm 1
|
|
lnx-node2.amer.lan
|
192.168.9.109
|
Fiziksel Düğüm 2
|
|
lnx-nwcluster.amer.lan
|
192.168.9.110
|
NetWorker tarafından kullanılan Mantıksal Ad
|
Düğümlerdeki dosya sistemi, NetWorker'ı sembolik bağlantılar kullanarak yönetir.
Aktif Düğüm:
/nsr Paylaşılan depolama konumuna:
root@lnx-node1:~# ls -l / | grep nsr
lrwxrwxrwx. 1 root root 14 Oct 5 10:49 nsr -> /nsr_share/nsr
drwxr-xr-x. 11 root root 116 Aug 31 17:20 nsr.NetWorker.local
drwxr-xr-x. 3 root root 17 Aug 31 17:23 nsr_share
Pasif Düğüm:
/nsr özniteliğinin değerini /nsr.NetWorker.local:
root@lnx-node2:~# ls -l / | grep nsr
lrwxrwxrwx. 1 root root 20 Oct 3 17:08 nsr -> /nsr.NetWorker.local
drwxr-xr-x. 11 root root 116 Aug 31 17:19 nsr.NetWorker.local
drwxr-xr-x. 2 root root 6 Aug 31 17:18 nsr_share
Bir düğüm pasif durumdayken nsrexecd (NetWorker istemcisi) yazılımı kullanarak çalışıyor /nsr.NetWorker.local. Her fiziksel düğümün, Etki Alanı Adı Sistemi (DNS) çözümlenebilir adını ve IP adresini kullanan kendi istemci kaynağı vardır. NetWorker sunucusu yalnızca paylaşılan depolamayı (/nsr_share) ve paylaşılan IP adresini ve ana bilgisayar adını kullanır. Bu, aynı anda yalnızca bir düğümde etkin olabilir.
Aşağıdaki kalp pili (pcs) komutları, kalp pili yapılandırmasına ve durumuna genel bir bakış elde etmek için kullanılır:
-
Küme yapılandırması:
pcs status
root@lnx-node1:~# pcs status Cluster name: rhelclus Status of pacemakerd: 'Pacemaker is running' (last updated 2023-10-05 10:59:19 -04:00) Cluster Summary: * Stack: corosync * Current DC: lnx-node1.amer.lan (version 2.1.5-9.3.el8_8-a3f44794f94) - partition with quorum * Last updated: Thu Oct 5 10:59:20 2023 * Last change: Thu Oct 5 10:59:13 2023 by root via cibadmin on lnx-node1.amer.lan * 2 nodes configured * 3 resource instances configured Node List: * Online: [ lnx-node1.amer.lan lnx-node2.amer.lan ] Full List of Resources: * Resource Group: NW_group: * fs (ocf::heartbeat:Filesystem): Started lnx-node1.amer.lan * ip (ocf::heartbeat:IPaddr): Started lnx-node1.amer.lan * nws (ocf::EMC_NetWorker:Server): Started lnx-node1.amer.lan Daemon Status: corosync: active/enabled pacemaker: active/enabled pcsd: active/enabled
fs), küme kaynağı IP adresi (ip) ve NetWorker hizmetleri (nws). Burada kullanılan kaynak adları, NetWorker Küme Entegrasyon Rehberi'nde kullanılan varsayılanlardır; Ancak, farklı isimlerin kullanılması mümkündür. Farklı adlar kullanıyorsanız, kaynak adlarını not edin ve bu makaledeki yönergeleri izlerken gerektiği gibi değiştirin.
- Pacemaker kaynak yapılandırması:
pcs resource config
Örneğin:
root@lnx-node1:~# pcs resource config Group: NW_group Resource: fs (class=ocf provider=heartbeat type=Filesystem) Attributes: fs-instance_attributes device=/dev/sdb1 directory=/nsr_share fstype=xfs Operations: monitor: fs-monitor-interval-20 interval=20 timeout=300 start: fs-start-interval-0s interval=0s timeout=60s stop: fs-stop-interval-0s interval=0s timeout=60s Resource: ip (class=ocf provider=heartbeat type=IPaddr) Attributes: ip-instance_attributes cidr_netmask=24 ip=192.1xx.9.1x0 nic=ens192 Operations: monitor: ip-monitor-interval-15 interval=15 timeout=120 start: ip-start-interval-0s interval=0s timeout=20s stop: ip-stop-interval-0s interval=0s timeout=20s Resource: nws (class=ocf provider=EMC_NetWorker type=Server) Meta Attributes: nws-meta_attributes is-managed=true Operations: meta-data: nws-meta-data-interval-0 interval=0 timeout=10 migrate_from: nws-migrate_from-interval-0 interval=0 timeout=120 migrate_to: nws-migrate_to-interval-0 interval=0 timeout=60 monitor: nws-monitor-interval-100 interval=100 timeout=1200 start: nws-start-interval-0 interval=0 timeout=600 stop: nws-stop-interval-0 interval=0 timeout=600 validate-all: nws-validate-all-interval-0 interval=0 timeout=10
Yukarıdaki komut, her birini ayrıntılı olarak açıklar pcs Kaynak yapılandırması. İlk genel bakış sırasında dikkat edilmesi gereken önemli noktalar:
- FS kaynağı "device=": Bu, düğüm dosya sistemindeki paylaşılmış depolama için bağlantı noktası olarak kullanılan aygıttır. Bu aygıt her düğümde aynı olmalıdır. Bu konu daha sonra bu KB de ele alınacaktır.
- FS resource "directory=": Bu, paylaşılan NetWorker depolamasının kullandığı dizindir. Dizin, "device=" alanı için bağlantı noktası olarak ilişkilendirilmelidir. Bu konu daha sonra bu KB de ele alınacaktır.
- IP kaynağı "ip=": Bu, NetWorker sunucusu tarafından kullanılan mantıksal (paylaşılan) ana bilgisayar adı ile ilişkili IP adresidir. Bu IP adresi aktif düğümde barındırılır.
- Paylaşılan adresin ve depolamanın pacemaker görünürlüğü:
lcmap
Örneğin:
root@lnx-node1:~# lcmap type: NSR_CLU_TYPE; clu_type: NSR_LC_TYPE; interface version: 1.0; type: NSR_CLU_VIRTHOST; hostname: 192.168.9.110; local: TRUE; owned paths: /nsr_share; clu_nodes: lnx-node1.amer.lan lnx-node2.amer.lan;
pcs resource config "ip=" alanı. Sahip olunan yollar pcs resource config "directory=" alanı. Bazı durumlarda, bir başlatma sorunu gözlemlendiğinde, lcmap Komut, ana bilgisayar adı, yerel veya sahip olunan yollar alanlarını döndürmez; Bu, bir sorunun göstergesidir.
İlk Teşhis:
NetWorker hizmetleri başlatılamıyorsa pcs Hangi kaynağın arızalı olduğunu görmek için Kaynak durumu:
pcs status
root@lnx-node1:~# pcs status ... ... Node List: * Online: [ lnx-node1.amer.lan lnx-node2.amer.lan ] Full List of Resources: * Resource Group: NW_group: * fs (ocf::heartbeat:Filesystem): Started lnx-node1.amer.lan * ip (ocf::heartbeat:IPaddr): Started lnx-node1.amer.lan * nws (ocf::EMC_NetWorker:Server): Started lnx-node1.amer.lan Daemon Status: corosync: active/enabled pacemaker: active/enabled pcsd: active/enabled
Bir hata gözlemlenirse, döndürülen genel bir hata hatası vardır. Başarısız olan kaynaklar BAŞARISIZ olarak gösterilir.
- FS (Dosya Sistemi): Dosya sistemi başarısız durumdaysa aşağıdaki Dosya Sistemi Arızaları bölümüne bakın.
- IP (IPaddr): IPaddr başarısız durumdaysa, IPaddr Hataları ile ilgili aşağıdaki bölüme bakın.
- NWS (Sunucu): NetWorker sunucusu arızalı durumdaysa aşağıdakileri yapın:
- NetWorker sunucusunun
daemon.rawbaşlatma sırasında görünen herhangi bir hata mesajı için. Sunucunun/nsr_share/nsr/daemon.rawpaylaşılan depolama yolunda bulunur. İstemci daemon'ının içinde bulunduğu fiziksel düğümler/nsr.NetWorker.local/logs/daemon.raw. NetWorker: şu Dell makalesine bakın: nsr_render_log'u kullanma - Varsayılan günlük yeterli değilse aşağıdakileri yaparak hata ayıklamayı etkinleştirin:
- Server" kaynağını yeniden başlatmayı deneyin:
pcs resource cleanup nws
- Video (Video) öğesini vurgulamak için
dbgcommandHata ayıklamayı etkinleştirmek içinnsrdişlem:
dbgcommand -n nsrd Debug=#
daemon.raw bir soruna yönlendirebilecek herhangi bir ek mesaj için.
- Şunu inceleyin:
/var/log/pcsd/pcsd.logherhangi bir hata için. - Şunu inceleyin:
/var/log/pacemaker/pacemaker.logherhangi bir hata için. - Şunu inceleyin:
/var/log/messagesherhangi bir hata için dosya.
pcsd, pacemaker ve mesaj günlükleri, NetWorker hizmetlerinin başlatılmaya çalışıldığı zaman damgaları sırasında günlüğe kaydedilen mesajları arar. Hizmet başlatma hatasıyla çakışan hataları veya arızaları inceleyin.
Dosya Sistemi Arızaları:
- Kalp pili kaynaklarını inceleyin:
pcs resource
- Filesystem kaynağı için pacemaker kaynak yapılandırmasını gözden geçirin:
pcs resource fs
root@lnx-node1:~# pcs resource
* Resource Group: NW_group:
* fs (ocf::heartbeat:Filesystem): Started lnx-node1.amer.lan
* ip (ocf::heartbeat:IPaddr): Started lnx-node1.amer.lan
* nws (ocf::EMC_NetWorker:Server): Started lnx-node1.amer.lan
root@lnx-node1:~# pcs resource config fs
Resource: fs (class=ocf provider=heartbeat type=Filesystem)
Attributes: fs-instance_attributes
device=/dev/sdb1
directory=/nsr_share
fstype=xfs
Operations:
monitor: fs-monitor-interval-20
interval=20
timeout=300
start: fs-start-interval-0s
interval=0s
timeout=60s
stop: fs-stop-interval-0s
interval=0s
timeout=60s
- Aygıtın FS ye takılı olup olmadığını doğrulayın:
df -h
Örneğin:
root@lnx-node1:~# df -h | grep /nsr_share /dev/sdb1 94G 1.5G 92G 2% /nsr_share
- Bağlantı noktasının doğru yapılandırılıp yapılandırılmadığını onaylayın; Cihazı yol ile ilişkilendirme:
lsblk
Örneğin:
root@lnx-node1:~# lsblk
NAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINT
sda 8:0 0 40G 0 disk
├─sda1 8:1 0 600M 0 part /boot/efi
├─sda2 8:2 0 1G 0 part /boot
└─sda3 8:3 0 38.4G 0 part
├─rhel-root 253:0 0 34.4G 0 lvm /
└─rhel-swap 253:1 0 4G 0 lvm [SWAP]
sdb 8:16 0 100G 0 disk
└─sdb1 8:17 0 93.1G 0 part /nsr_share
sr0 11:0 1 1024M 0 rom
- Cihaz tarafından kullanılan dosya sisteminin doğru olduğunu onaylayın:
blkid
root@lnx-node1:~# blkid
/dev/mapper/rhel-root: UUID="7cf2f957-18d8-45b8-bf8f-6361aadc3517" BLOCK_SIZE="512" TYPE="xfs"
/dev/sda3: UUID="QpZ2hK-OuE2-igN0-Ryba-EwMN-uxq1-LE48hD" TYPE="LVM2_member" PARTUUID="1193db91-4b63-4b33-a4d4-03a22317e064"
/dev/sda1: UUID="F243-AD41" BLOCK_SIZE="512" TYPE="vfat" PARTLABEL="EFI System Partition" PARTUUID="6c81bd63-0249-4bdf-afdb-cdde72034162"
/dev/sda2: UUID="7677ad6b-8191-4a45-8a8a-16cf7d00d72c" BLOCK_SIZE="512" TYPE="xfs" PARTUUID="57481b7a-83ec-4cd8-bf2d-bca09ac27040"
/dev/sdb1: UUID="600bca60-dd5d-4162-bf77-0537daa3b1e5" BLOCK_SIZE="512" TYPE="xfs" PARTLABEL="networker" PARTUUID="769aaac2-764b-431d-be21-3b5753d6a5d3"
/dev/mapper/rhel-swap: UUID="537962b6-07d4-4a40-9687-deab2e488936" TYPE="swap"
/var/log/pcsd/pcsd.log/var/log/pacemaker/pacemaker.log/var/log/messages
IPaddr Hataları:
- Kalp pili kaynaklarını inceleyin:
pcs resource
- Filesystem kaynağı için pacemaker kaynak yapılandırmasını gözden geçirin:
pcs resource config ip
root@lnx-node1:~# pcs resource
* Resource Group: NW_group:
* fs (ocf::heartbeat:Filesystem): Started lnx-node1.amer.lan
* ip (ocf::heartbeat:IPaddr): Started lnx-node1.amer.lan
* nws (ocf::EMC_NetWorker:Server): Started lnx-node1.amer.lan
root@lnx-node1:~# pcs resource config ip
Resource: ip (class=ocf provider=heartbeat type=IPaddr)
Attributes: ip-instance_attributes
cidr_netmask=24
ip=192.1xx.9.1x0
nic=ens192
Operations:
monitor: ip-monitor-interval-15
interval=15
timeout=120
start: ip-start-interval-0s
interval=0s
timeout=20s stop:
ip-stop-interval-0s
interval=0s
timeout=20s
- NIC'nin sistemde mevcut olup olmadığını onaylayın:
ifconfig -a
root@lnx-node1:~# ifconfig -a
ens192: flags=4163<UP,BROADCAST,RUNNING,MULTICAST> mtu 1500
inet 192.1xx.9.1x8 netmask 255.255.255.0 broadcast 192.1xx.9.255
inet6 fe80::250:56ff:fea5:48e1 prefixlen 64 scopeid 0x20<link>
ether 00:50:56:a5:48:e1 txqueuelen 1000 (Ethernet)
RX packets 953865 bytes 349705527 (333.5 MiB)
RX errors 0 dropped 0 overruns 0 frame 0
TX packets 1190983 bytes 179749786 (171.4 MiB)
TX errors 0 dropped 0 overruns 0 carrier 0 collisions 0
lo: flags=73<UP,LOOPBACK,RUNNING> mtu 65536
inet 127.0.0.1 netmask 255.0.0.0
inet6 ::1 prefixlen 128 scopeid 0x10<host>
loop txqueuelen 1000 (Local Loopback)
RX packets 129798 bytes 13274289 (12.6 MiB)
RX errors 0 dropped 0 overruns 0 frame 0
TX packets 129798 bytes 13274289 (12.6 MiB)
TX errors 0 dropped 0 overruns 0 carrier 0 collisions 0
Şu şekilde gösterilir: ifconfig fiziksel düğüm adıyla eşleşir; ancak düğüm etkin olduğunda kümelenmiş IP'ye bu NIC üzerinden erişilebilir. Her iki düğümün de aynı NIC adlarını kullanacak şekilde yapılandırıldığından emin olun.
- IP adresi, NetWorker sunucusu tarafından kullanılan doğru (mantıksal) ana bilgisayar adına çözümleniyor mu?
nslookup ip nslookup logical_name_FQDN nslookup logical_name_short
root@lnx-node1:~# nslookup 192.1xx.9.1x0 110.9.1xx.1x2.in-addr.arpa name = lnx-nwcluster.amer.lan. root@lnx-node1:~# nslookup lnx-nwcluster.amer.lan. Server: 192.1xx.9.1x0 Address: 192.1xx.9.100#53 Name: lnx-nwcluster.amer.lan Address: 192.1xx.9.1x0 root@lnx-node1:~# nslookup lnx-nwcluster Server: 192.1xx.9.1x0 Address: 192.1xx.9.100#53 Name: lnx-nwcluster.amer.lan Address: 192.1xx.9.1x0
Aynı adımların fiziksel düğümün IP adresi, FQDN ve kısa adı için de uygulanması önerilir. NetWorker: şu Dell makalesine bakın: Ad Çözümlemesi Sorun Giderme En İyi Yöntemleri.
- Şunu kullanarak küme IP adresine ulaşabiliyor musunuz?
ping?
ping -c 4 ip
root@lnx-node1:~# ping -c 4 192.1xx8.9.1x0 PING 192.1xx8.9.1x0 (192.1xx.9.1x0) 56(84) bytes of data. 64 bytes from 192.1xx.9.1x0: icmp_seq=1 ttl=64 time=0.051 ms 64 bytes from 192.1xx.9.1x0: icmp_seq=2 ttl=64 time=0.043 ms 64 bytes from 192.1xx.9.1x0: icmp_seq=3 ttl=64 time=0.033 ms 64 bytes from 192.1xx.9.1x0: icmp_seq=4 ttl=64 time=0.034 ms --- 192.1xx.9.1x0 ping statistics --- 4 packets transmitted, 4 received, 0% packet loss, time 3108ms rtt min/avg/max/mdev = 0.033/0.040/0.051/0.008 ms
/var/log/pcsd/pcsd.log/var/log/pacemaker/pacemaker.log/var/log/messages
Diğer PCS Komutları:
| İşlem | Komut |
Kalp pili veya pcs version: |
|
| Pacemaker'a Genel Bakış |
|
| Pacemaker kaynağına genel bakış |
|
| Bir kümedeki yol sahipliğini belirleyin. |
|
| Kaynağı etkinleştirme (başlatma). |
|
Başlat pcs hata ayıklamalı kaynak. |
|
| Bilgisayarların kaynak yapılandırma ayarlarını gözden geçirme |
|
| Kaynağı devre dışı bırakma (durdurma): |
|
| Yeniden başlatma işlemi başarısız olan kaynak. |
|
| Düğümde kalp pilini durdurun. |
|
| Kalp pilini başlat |
|
| Düğümü bekleme moduna alın. |
|
| Düğümü bekleme modundan çıkarın. |
|
Önemli Günlükler ve Dosyalar:
| Yol | Amaç | Tamamlayıcı Komutlar |
/var/log/messages |
Sistem kaynakları ve hizmetleriyle ilgili genel sistem mesajlarını içerir. |
|
/var/log/pacemaker/pacemaker.log |
Kalp pili kaynakları ve işlevleri için varsayılan kalp pili bilgileri günlüğü. | Yok |
/var/log/pcsd/pcsd.log |
Varsayılan kalp pili hizmeti/geriplanı (pcsd) günlüğü. |
Yok |
/var/log/cluster/corosync.log |
Varsayılan kalp pili düğümü iletişim günlüğü. | Yok |
/usr/sbin/nw_hae.log |
NetWorker (nws) içinde tanımlandığı şekilde kaynak başlatma günlüğü /usr/lib/ocf/resource.d/EMC_NetWorker/Server |
Yok |
/usr/lib/ocf/resource.d/EMC_NetWorker/Server |
NetWorker pacemaker yapılandırma dosyası. Bu, pc'ler tarafından gerçekleştirilen/yönetilen işlemlerdir. | Yok |