Metro node: Metro düğümünden günlükleri toplama
Summary: Bu makalede, metro düğümünden günlüklerin nasıl toplanacağına ilişkin adımlar özetlenir ve ayrıca bir performans sorunu için hangi günlüklerin/verilerin gerekli olabileceği ele alınır.
Instructions
Aşağıdaki görevlerin nasıl gerçekleştirileceğine ilişkin adımlar:
- Metro düğümü sorunlarında hata ayıklamak için hangi günlükler gereklidir?
- Bir metro düğümü kümesinde toplama tanılamalarını nasıl yakalayabilirim?
- Yönetim sunucularındaki mevcut collect-diagnostics paketleri nasıl doğrulanır?
- Metro düğümünde devam eden bir toplama tanılaması nasıl iptal edilir ve temizlenir?
A. Metro düğümü sorunlarında hata ayıklamak için hangi günlükler gereklidir?
-
Metro düğümünden günlükleri toplamak için gereken komut "collect-diagnostics" olarak adlandırılır ve metro düğümü kurulumundaki herhangi bir düğümden (*1) çalıştırılabilir. Bu komutu bir metro düğümü kümesinin bir yöneticisinde çalıştırmak, bir kümenin tüm düğümlerinden ve tüm yöneticilerden gelen tüm verilere sahip olmalıdır. Bu komutu aynı anda birden fazla düğümde ÇALIŞTIRMAYIN.
*1 NOT: Metro yapılandırması varsa yalnızca bir kümede yalnızca bir yöneticiden "collect-diagnostics" komutunu çalıştırın ve CD'leri başka bir yöneticiden veya gerekirse eş kümeden almadan önce işlemin tamamen tamamlanmasını bekleyin. -
"collect-diagnostics" komutu, yapılandırma ve günlük dosyalarını içeren sıkıştırılmış bir tar.gz günlük dosyası oluşturur. collect-diagnostics dosyası, çalıştırıldığı düğümdeki /diag/collect-diagnostics-out/ dizinine eklenir. Komut tamamlandığında, dosyayı düğümden kopyalamak için WINSCP veya eşdeğer bir SCP yardımcı programı kullanın; böylece bu, daha sonra analiz desteği için sağlanabilir. Bu komutun kullanımı hakkında daha fazla bilgiyi aşağıdaki B bölümünde bulabilirsiniz.
Notlar:- "collect-diagnostics" komutu seçenekler eklenmeden çalıştırılırsa bir temel dosya ve bir genişletilmiş dosya olmak üzere iki dosya oluşturulur. Bu, ölçekli sistemlerde oldukça uzun zaman alabilir.
- Metro düğümü desteği genellikle yalnızca Temel dosyayı gerektirir, ancak bazı durumlarda performans sorunları genişletilmiş dosya için de isteyebilirler.
- collect-diagnostics çalıştırılırken kullanılması istenebilecek standart seçenekler şunlardır:
- )
--noextended": Bu seçenek, genişletilmiş tanılama koleksiyonunu atlar. - )
--last-logs": Bu seçenek, günlükleri x saat veya gün düzeyinde geri yakalar.
- )
- Komutla ilgili daha fazla ayrıntı için "collect-diagnostics -h" yazabilirsiniz
Bunlar, bu iki dosya adının nasıl göründüğüne dair örneklerdir; YYYY-MM-DD-HH.MM.SS olarak gösterilen tarih ve saat, bunların toplandığı tarih ve saatten itibarendir:
- Temel dosya:
<Serial number>-c1-diag-YYYY-MM-DD-HH.MM.SS.tar.gz - Genişletilmiş dosya:
<Serial number>-c1-diag-ext-YYYY-MM-DD-HH.MM.SS.tar.gz
-
Performans sorunları karmaşıktır ve çok fazla spesifik bilginin toplanmasını gerektirir. Dolayısıyla bu süreci hızlandırmak için müşterilerin doldurmaları istenen bir performans anketimiz mevcuttur. Anket, bu bilgi bankası makalesinin sonundaki ek bölümünde bulunabilir.
-
Bazı performans sorunu türlerinde, "fe_perf_stats" adlı ek bir günlük yakalamak yararlı olur. Günlükler sürekli olarak oluşturulur ancak collect-diagnostics tarafından yakalanmaz. Bu günlüğü yakalamak için her kümeden bir düğümde /var/log/VPlex/cli öğesine cd (dizini değiştir) yazın ve "tar cvzf fe-perf-stats.tar.gz fe_perf_stats*" komutunu çalıştırarak dosyaların verilerini bir tar dosyasına sıkıştırın. WINSCP veya eşdeğer bir SCP yardımcı programı ile düğüme bağlanın ve /var/log/VPlex/cli yoluna gidin. fe-perf-stats.tar.gz" dosyasını sisteminize kopyalayın. Destek tarafından talep edildiyse tar dosyasını, bir veya daha fazla tanılama toplama dosyasıyla birlikte SR'ye veya destek ekibinin SR'de size sağladığı bir ftp bağlantısına ve bir e-postaya yükleyin.
-
Tanılamayı toplamanın yanı sıra aşağıdaki bilgileri de yakalamak faydalı olabilir;
- Bir putty oturumu için açık günlüğe kaydetme,
- Ardından aşağıdaki komutları çalıştırın,
- Ardından Putty günlüğünü toplayın ve sisteminize indirin,
- Ardından PuTTY günlüğünü, toplama tanılamalarını ve istenen diğer verileri SR'ye ekleyin.
VPlexcli komut isteminden aşağıdaki komutlar çalıştırılmalıdır.
cluster statusll clusters/**/storage-views/* --fullll ~portsshow-use-hierarchy /clusters/**/virtual-volumes/*ll ~system-volumesls -t /clusters/*/directors/*::serial-number(Bu komut her düğüm için tüm DST'leri listeler)ls -t /clusters/**/director-*/::hostname(ana bilgisayar adları IP Adresleridir; bu beklenen bir durumdur)
B. Bir metro düğümü kümesinde toplama tanılamalarını nasıl yakalayabilirim?
Bu verileri yakalamak için "--noextended" ve "--last-logs 30d" bayraklarıyla bir collect-diagnostics komutu çalıştırın.
-
Yönetici düğümü Linux isteminde (örneğin, service@director-1-1-a) bir SSH oturumu oluşturun, ardından vplexcli de oturum açın.
Örnek çıktı:
login as: service Keyboard-interactive authentication prompts from server: | Password: End of keyboard-interactive prompts from server Last login: <date and timestamp data> from x.x.x.x service@director-1-1-a:~> service@director-1-1-a:~> vplexcli Trying ::1... Connected to localhost. Escape character is '^]'. VPlexcli:/>
-
collect-diagnostics işlemini başlatmak için vplexcli komut isteminden aşağıdaki örnekte gösterildiği gibi yönlendirilmiş seçeneklerle "collect-diagnostics" komutunu çalıştırın.
Örnek Çıktı:
VPlexcli:/> collect-diagnostics --noextended --last-logs 30d ('WARNING:The collect-diagnostics command was issued with option --noextended. ',) The following file(s) will NOT be collected: core files fast trace dump files slow trace dump files udcom trace dump files udcom legacy trace files user-defined performance sink files the management console's heap ('WARNING:Only the logs that are generated in the last 30 days are collected.') 2024-02-09 19:55:12 UTC: ****Initializing collect-diagnostics... 2024-02-09 19:55:13 UTC: No cluster-witness server found. 2024-02-09 19:55:13 UTC: Free space = 88G 2024-02-09 19:55:13 UTC: Total space needed = 1907M ================================================================================ Starting collect-diagnostics, this operation might take a while... ================================================================================ Executing cluster collection ..
C. Yöneticideki/düğümdeki mevcut tanılama toplama paketlerini doğrulama.
-
Collect-diagnostics komutu tamamlandığında ve vplexcli istemine geri döndüğünde, winscp'yi [veya eşdeğer bir SCP yardımcı programını] kullanarak komutu çalıştırdığınız yöneticiye bağlanın ve /diag/collect-diagnostics-out/ klasörüne gidin
-
Doğru zaman damgasına sahip bir veya daha fazla günlük dosyasını belirleyin ve bunları yerel iş istasyonunuza indirin.
D. Devam eden bir toplama tanılaması nasıl iptal edilir
-
Hâlâ collect-diagnostics işlemini başlattığınız PuTTY oturumundaysanız collect-diagnostics çıktı akışının çalışıyor olduğunu görürsünüz.
Örnek Çıktı:
VPlexcli:/> collect-diagnostics --noextended --last-logs 30d ('WARNING:The collect-diagnostics command was issued with option --noextended. ',) The following file(s) will NOT be collected: core files fast trace dump files slow trace dump files udcom trace dump files udcom legacy trace files user-defined performance sink files the management console's heap ('WARNING:Only the logs that are generated in the last 30 days are collected.') 2022-02-09 19:55:12 UTC: ****Initializing collect-diagnostics... 2022-02-09 19:55:13 UTC: No cluster-witness server found. 2022-02-09 19:55:13 UTC: Free space = 88G 2022-02-09 19:55:13 UTC: Total space needed = 1907M ================================================================================ Starting collect-diagnostics, this operation might take a while... ================================================================================ Executing cluster collection .. -
Yinelenen bir PuTTY oturumu açın ve hizmet hesabını kullanarak collect-diagnostics işlemini başlattığınız yöneticide oturum açın.
Örnek Çıktı:
login as: service Using keyboard-interactive authentication. Password: Last login: <date and time stamp data> from x.x.x.x service@director-1-1-b:~>
-
Yöneticiye ulaştıktan sonra, çalışmakta olan tanılama toplama işlemini iptal etmek için aşağıdaki komutu kullanarak yönetim konsolunu yeniden başlatın.
Örnek Çıktı:
service@director-1-1-b:~> sudo systemctl restart VPlexManagementConsole.service
-
Yönetim konsolunu yeniden başlattığınızda collect-diagnostics in çalıştığı ilk PuTTY oturumuna geri dönüp baktığınızda, collect-diagnostics raporunun son not edilen çıktı olarak şu olduğunu görmeniz gerekir:
"Connection closed by foreign host."
Örnek çıktı (Çıktının son satırını kontrol edin):
VPlexcli:/> collect-diagnostics --noextended --last-logs 30d ('WARNING:The collect-diagnostics command was issued with option --noextended. ',) The following file(s) will NOT be collected: core files fast trace dump files slow trace dump files udcom trace dump files udcom legacy trace files user-defined performance sink files the management console's heap ('WARNING:Only the logs that are generated in the last 30 days are collected.') 2022-02-09 20:02:03 UTC: ****Initializing collect-diagnostics... 2022-02-09 20:02:04 UTC: No cluster-witness server found. 2022-02-09 20:02:04 UTC: Free space = 88G 2022-02-09 20:02:04 UTC: Total space needed = 1907M ================================================================================ Starting collect-diagnostics, this operation might take a while... ================================================================================ Executing cluster collection .. ERROR Executing SMS log collection .. Connection closed by foreign host. <<< -
Toplama-tanılamanın durdurulduğu görüldüğünde, yukarıdaki 3. adımda, ikinci PuTTY oturumuna geri dönün ve /diag dizinine 'cd' yazın, ardından 'll' komutunu çalıştırın ve bazı ekstra dizinler görmeniz gerekir,
collect-diagnostics-tmpcollect-diagnostics-jobscollect-diagnostics-tmp-ext*
*genişletilmiş dosyalar çıkarılmadıysa
Örnek çıktı:
service@director-1-1-b:/diag> ll total 32 drwxr-xr-x 2 service groupSvc 4096 Feb 9 20:03 collect-diagnostics-tmp-ext drwxr-xr-x 2 service groupSvc 4096 Feb 9 20:03 collect-diagnostics-jobs drwxr-xr-x 2 service groupSvc 4096 Feb 9 20:04 collect-diagnostics-out drwxr-xr-x 3 service groupSvc 4096 Feb 9 20:02 collect-diagnostics-tmp drwx------ 2 root root 16384 Jan 27 16:54 lost+found drwx--x--x 3 service groupSvc 4096 Dec 17 03:08 share service@director-1-1-b:/diag>
-
Bu dizinlerin her birinin içine bakarsanız, artık iptal edilen toplama tanılamasını başlattığınız tarih ve saate sahip dosyalar görürsünüz. Bu dosyalar /diag bölümünde yer kaplar ve kaldırılmalıdır.
-
Dosyaları /diag dizininden kaldırmak/silmek için "rm -r collect-diagnostics-jobs" ve "rm -r collect-diagnostics-tmp" yazın ve ardından dizinlerin silindiğinden veya kaldırıldığından emin olmak için tekrar 'll' girin.
Örnek çıktı:
service@director-1-1-b:/diag> rm -r collect-diagnostics-jobs service@director-1-1-b:/diag> rm -r collect-diagnostics-tmp service@director-1-1-b:/diag> ll total 24 drwxr-xr-x 2 service groupSvc 4096 Feb 9 20:04 collect-diagnostics-out drwx------ 2 root root 16384 Jan 27 16:54 lost+found drwx--x--x 3 service groupSvc 4096 Dec 17 03:08 share service@director-1-1-b:/diag>
-
Bir "collect-diagnostics-tmp-ext" dizini varsa bu dizini kaldırın ve "rm -r collect-diagnostics-tmp-ext" komutunu çalıştırın
Not: Genişletilmiş dosya genellikle düğüm çökmelerini araştırmak için kullanılır. Düğüm çökmesiyle ilgili devam eden bir araştırma varsa ve destek ekibi gerekli tüm günlükleri kaydetmediyse collect-diagnostics-tmp-ext dizinini temizlemeden önce destek ekibiyle iletişime geçin; aksi takdirde gerekli temel dosyalar silinebilir.