Ana içeriğe atla
  • Hızla ve kolayca sipariş verin
  • Siparişleri görüntüleyin ve kargonuzun durumunu izleyin
  • Ürünlerinizin listesini oluşturun ve listeye erişin

Anahtar Yapısı Modülüne Yönelik Sorun Giderme

Summary: Anahtar Yapısı Modülüne Yönelik Sorun Giderme

Bu makale şunlar için geçerlidir:   Bu makale şunlar için geçerli değildir: 

Symptoms

İçindekiler:
  1. Giriş
  2. Son Güç Kapatma Nedenini Belirleme
  3. Sorun Giderme Belirtileri
  4. Bir TAC Vakası Açtığınızda Toplanacak Bilgiler

Giriş

Bu belge öncelikle E Serisi sistemde Anahtar Yapı Modülünde (SFM) sorun gidermeye yöneliktir ancak C Serisi SFM'lere de uygulanabilir.
E Serisinde SFM, sahada değiştirilebilir birim (FRU) adı verilen ayrı bir bileşendir. C Serisinde, anahtar yapısı RPM ye entegre edilmiştir. Bununla birlikte, bu belgede açıklananlar da dahil olmak üzere, SFM'yi yönetmeye yönelik FTOS komutları, aksi belirtilmedikçe, C Serisinde kullanışlıdır.
Nadir durumlarda, bir SFM önyükleme sırasında veya yükseltme sonrasında başlatılamaz ya da çalışma sırasında beklenmedik şekilde kapanabilir. Bu belge bu vakaları ele almaktadır.

Son Güç Kapatma Nedenini Belirleme

Show trace komutu çıktısında gösterildiği gibi sistem izleme işlevi, bir SFM'nin ne zaman kapatıldığını veya kapatılıp kapatıldığını bildirir. Şu başlıklı günlük mesajlarını arayabilirsiniz:
 "Found SFM #, last power-cycle reason:", as highlighted below in a sample of show trace output.Force10#show trace 100 | grep SFM[2/19 13:18:59] RAM-(RpmAvailMgr):Send data sync msg (42) to task 4 SFM Config State ).[2/19 13:22:47] TSM-(tsm):Receive SFM 7 SFM_DETECT REMOVE event.[2/19 13:22:47] TSM-(tsm):tsmSfmRemove: Remove SFM 7[2/19 13:22:47] TSM-(tsm):tsmSfmRemove: SFM 7 is powered off.[2/19 13:22:48] TSM-(tsm):tsmSfmRemove: SFM 7 is powered on.[2/19 13:22:49] TSM-(tsm):Set SFM minor alarm[2/19 13:22:49] TSM-(tsm):tsmSfmRemove:8: SW FAB is good after removing SFM 7
[2/19 13:22:50] TSM-(tsm):Receive SFM 7 SFM_DETECT INSERT event.
[2/19 13:22:50] TSM-(tsm):SFM 7 is reset with SFM Card insert event, bring up the card
[2/19 13:22:50] TSM-(tsm):Found SFM 7, last power-cycle reason: power on with cause of DEFAULT
[2/19 13:22:50] TSM-(tsm):TSM initilizes SFM 7...
[2/19 13:22:51] ****** ERROR CHMGR-(chmgr):SFM 7 not present or bad slot id
[2/19 13:22:52] TSM-(tsm):Clear SFM minor alarm
[2/19 13:22:52] TSM-(tsm):tsmSfmAdd:8: LC is in service, no PP test. SFM 7 standby. numSfmFound = 9
[2/19 13:22:52] TSM-(tsm):Receive SFM 7 RESET_DETECT ASSERT event.
[2/19 13:22:52] TSM-(tsm):SFM 7 reset is cleared, no action

Genel olarak, sistem izlemesi SFM sıfırlaması için üç neden görüntüler:
  1. remote-power-off – SFM kapatılıp açıldığından beri, hem yeniden başlatmadan önce hem de sistem başlatılırken sık rapor edilir. SFM yuva numarasını sıfırlama komutu verildiğinde de bir "uzaktan kapatma" nedeni bildirilir, çünkü bu komut SFM'yi kapatıp açar.
    Not: Bu komut yalnızca FTOS 6.5.4.0 ve üzeri sürümlerde ve E Serisinde kullanılabilir.
  2. card-removed: Bir SFM yi çıkarıp yeniden takarsanız show trace output, son güç döngüsü nedeni olarak card-removed değerini bildirir. Yazılım, dahili bir veri yolu üzerinden belirli bilgilerin okunamadığını algıladığında ve bu durumu SFM'nin kaldırıldığı şeklinde yorumladığında bu durum bildirilmez.
  3. Sahte Sıfırlama
Buna ek olarak, bekleme kartını CLI'dan uzaktan sıfırlarsanız izlemede "uzaktan sıfırlama" nedeni görüntülenir. 
 

Sorun Giderme Belirtileri

FTOS Chassis Manager (CHMGR) işlemi, SFM'nin sağlığını ve durumunu izler. İşlem SFM ile ilgili bir sorun algıladığında, RPM0 küçük bir alarm bildirir ve SFM'yi geri yükleme girişimi olarak kartı sıfırlar. TSM işlemi, bir SFM'nin bulunduğunu ve küçük alarm durumunun temizlendiğini bildirir.
RPM, "Bekleme SFM'si çalışmıyor" bildirirse anahtar beklemedeki SFM olmadan çalışıyordur. Bunun bir nedeni, belirli bir yuvadaki SFM'nin sıfırlama işleminden sonra henüz çevrimiçi olmaması olabilir. Bu SFM çevrimiçi olduğunda küçük alarm temizlenir, kasa yöneticisi yeni SFM'yi algılar ve kasaya ve SFM sayısına bağlı olarak "Found X SFM" mesajı görüntülenir.
Genel olarak, SFM ile ilgili bir sorunu gidermek için aşağıdaki çıktıyı alarak başlayın:
show trace

show logging

Dec 30 11:12:20 PST: %RPM0:CP %CHMGR-2-MINOR_SFM: Minor alarm: No working standby SFM
Dec 30 11:12:20 PST: %RPM0:CP %TSM-2-SFM_RESET_PRESENT: SFM 2 reset unexpectedly
Dec 30 11:12:22 PST: %RPM0:CP %TSM-6-SFM_DISCOVERY: Found SFM 2
Dec 30 11:12:23 PST: %RPM0:CP %CHMGR-5-MINOR_SFM_CLR: Minor alarm cleared: Working standby SFM present
Dec 30 11:12:23 PST: %RPM0:CP %TSM-6-SFM_DISCOVERY: Found 9 SFMs
show sfm all

Bir SFM küçük alarm durumunda yanıp söner veya geçiş yaparsa sistem yeterli güç almıyor olabilir. Bu durumda, sistem önce SFM'yi indirir. Her SFM bir gerilim eşiği ile yapılandırılır ve bu değere göre önce ilgili SFM kapatılır. Bu SFM çırpma işlemi, sisteme giden gerilim stabilize olana kadar gerçekleşir. Yeterli güç olup olmadığını belirlemek için, herhangi bir Valere güç doğrultucusunun bir tuğla arızası yaşayıp yaşamadığını fiziksel olarak doğrulayın. Düşük Güç Koşullarında Sorun Giderme adlı ayrı belgeye de bakın.
Aşağıdaki bölümlerde SFM'deki belirli hataların nasıl giderileceği açıklanmaktadır.

Genel Erişim Hataları
İki tür SFM genel erişim hatası vardır:
"m" - MDIO error
"I" - I2C access error

Bu erişim hataları genellikle bir donanım sorununa işaret eder.

SFM'nizin genel erişim hatasıyla karşılaşıp karşılaşmadığını belirlemek için "SFM 3 genel erişim hatası buldu" gibi ilgili bir sistem günlüğü mesajı olup olmadığına bakın.
Feb Feb 19 04:44:02: %RPM0:CP %TSM-6-SFM_SWITCHFAB_STATE: Switch Fabric: DOWN 
Feb 19 04:44:02: %RPM0:CP %TSM-2-SFM_GENERAL_ACCESS_M: SFM 3 found general access error (type m) 
Feb 19 04:44:05: %RPM0:CP %TSM-6-SFM_DISCOVERY: Found SFM 3 
Feb 19 04:44:06: %RPM0:CP %TSM-6-SFM_SWITCHFAB_STATE: Switch Fabric: UP 
Feb 19 04:44:36: %RPM0:CP %TSM-6-SFM_SWITCHFAB_STATE: Switch Fabric: DOWN 
Feb 19 04:44:37: %RPM0:CP %CHMGR-0-MAJOR_SFM: Major alarm: Switch fabric down 
Feb 19 04:44:38: %RPM0:CP %TSM-2-SFM_UNDER_VOLT: SFM 3 powered off due to under voltage
SFM Simba PSI access error

SFM'deki bir "Simba PSI" hatası genellikle bir donanım sorununa işaret eder. (Simba, SFM'deki bir donanım yongasını ifade eder.) 
  • show trace Output
    [6/4 2:13:13] TSM-(tsm):Receive SFM 1 ERR_DETECT event 
    [6/4 2:13:13] TSM-(tsm):tsmSfmRemove: Remove SFM 1 
    [6/4 2:13:13] TSM-(tsm):tsmSfmRemove: SFM 1 is powered off. 
    [6/4 2:13:13] POLLER-(PM):doSfmSaSanErr: eventId=17, slotId=1, state=1, value[0]=0x1fd, value[1]=0x0 
    [6/4 2:13:14] TSM-(tsm):tsmSfmRemove: SFM 1 is powered on. 
    [6/4 2:13:14] CHMGR-(chmgr):add min alrm 12 UNKNOWN 0 0 
    [6/4 2:13:14] CHMGR-(tsm):0x1382 log alrm 12 to chmgr (rc=84) 
    [6/4 2:13:14] TSM-(tsm):Set SFM minor alarm 
    [6/4 2:13:14] TSM-(tsm):Change SW FAB state from SW_FAB_UP_9 to 
    SW_FAB_UP_8  
    !—The Etherscale supports one SFM in standby mode. The Terascale requires all 9 SFMs to be operationally active.[5/4 2:13:14] ***** WARNING TSM-(tsm):Turn off SFM 1 active LED fail. 
    [5/4 2:13:14] ***** WARNING TSM-(tsm):Turn on SFM 1 Status LED Amber fail. 
    !—During a failure, check the Status LED.  
    [5/4 2:13:15] ****** ERROR TSM-(tsm):tsmIsSfmPowerOn: 
    f10SysRpmSfmCardInfoGet() failed for SFM 1 power status 
    [5/4 2:13:15] ****** ERROR TSM-(tsm):CheckSFMCardPower: tsmIsSfmPowerOn() failed for SFM 1 power status 
    [5/4 2:13:15] ****** ERROR TSM-(tsm):tsmHandleSfmError: Different error detected on SFM 1 (erro = 262163). SFM already 
    in SFM_ERROR state 
    [6/4 2:13:15] TSM-(tsm):SFM 1 ERR_DETECT event is confirmed 
    [6/4 2:13:15] TSM-(tsm):Receive SFM 1 SIMAB_DETECT event 
    [5/4 2:13:15] ****** ERROR TSM-(tsm):tsmIsSFMReset: SFM 1 is not 
    accessible via scratch pad (SFM_FAITH_CR = 0) 
    [6/4 2:13:15] TSM-(tsm):tsmSfmRemove: Remove SFM 1 
    [6/4 2:13:15] TSM-(tsm):tsmSfmRemove: SFM 1 is powered off. 
    [6/4 2:13:16] TSM-(tsm):tsmSfmRemove: SFM 1 is powered on. 
    [5/4 2:13:16] ***** WARNING TSM-(tsm):Turn off SFM 1 active LED fail. 
    [5/4 2:13:16] ***** WARNING TSM-(tsm):Turn on SFM 1 Status LED Amber fail. 
    [5/4 2:13:17] ****** ERROR TSM-(tsm):tsmIsSfmPowerOn: 
    f10SysRpmSfmCardInfoGet() failed for SFM 1 power status 
  • show sfm all
    Force10#sh sfm all 
    Switch Fabric State: up 
    -- Switch Fabric Modules -- Slot Status 
    --------------------------------------------------------------------------- 
    0 card problem (SFM Simba PSI access error) 
    1 active 
    2 active 
    3 active 
    4 active 
    5 active 
    6 active 
    7 active 
    8 active 

"SFM, SW FAB portpipe tanılamalarında başarısız oldu"

Bu durum genellikle bir donanım sorununa işaret eder. RMA talep etmeden önce sorun giderme yardımı için Force10 Networks TAC ile iletişime geçin.
Force10#show chassis brief

Chassis Type  : E300

Chassis Mode  : TeraScale

Chassis Epoch : 10.4 micro-seconds

--  Line cards --

Slot  Status        NxtBoot    ReqTyp   CurTyp   Version     Ports
--------------------------------------------------------------------------- 
  0   online        online     EX1YE3   EX1YE3   5.3.1.2b    1  
  1   online        online     EX1YE3   EX1YE3   5.3.1.2b    1  
  2   online        online     EX1YE3   EX1YE3   5.3.1.2b    1  
  3   online        online     EX1YE3   EX1YE3   5.3.1.2b    1  
  4   online        online     E12PE3   E12PE3   5.3.1.2b    12  
  5   not present                    

--  Route Processor Modules --

Slot  Status        NxtBoot    Version 
--------------------------------------------------------------------------- 
0   active        online     5.3.1.2b 
1   not present

Switch Fabric State:  up

--  Switch Fabric Modules --

Slot  Status                    

---------------------------------------------------------------------------

  0   SW FAB diags failed  (Multiple SFMs failed SW FAB portpipe diags)

  1   active    

[output omitted]

 

Çeşitli koşullar altında büyük bir alarm bildirilir. Bu koşullardan biri, çevre izleme donanımı ve yazılımı tarafından algılandığı üzere SFM güvenli çalışma sıcaklığının aşılmasıdır. Ortamı gösterkomutu, hata mesajlarına ek olarak yüksek sıcaklık durumunu da yakalayabilir:

Feb 27 04:52:16 UTC: %RPM0:CP %CHMGR-2-TEMP_SHUTDOWN_WARN: WARNING! SFM 6 temperature is 85C; approaching shutdown threshold of 80C)

Feb 27 04:52:16 UTC: %RPM0:CP %CHMGR-2-MAJOR_TEMP: Major alarm: chassis temperature high (SFM temperature reaches or exceeds threshold of 75C)

Feb 27 04:52:21 UTC: %RPM0:CP %CHMGR-2-MAJOR_TEMP_CLR: Major alarm cleared: chassis temperature lower (SFM 6 temperature is within threshold of 70C)

Bu durum meydana geldiğinde ya SFM gerçekten çok sıcaktır ya da bir sensör arızalanmıştır. Doğrudan bitişik SFM'ler normal sıcaklıktaysa, arızalı bir sensörden şüphelenin. Doğrudan bitişik SFM'ler normal sıcaklıkta değilse, gerçek bir aşırı ısınma durumundan şüphelenin.

 

Sistem gerçek bir aşırı sıcaklık durumu algıladığında, SFM soğuyana ve yazılım yeniden güç vermenin güvenli olduğuna karar verene kadar SFM'yi kapatır. Yeniden güç verildiğinde, SFM sıfırlama nedeni donanım tarafından "aşırı sıcaklık" olarak bildirilir. Yazılım aşırı sıcaklık olayını algılar ve SFM'yi manuel olarak kapatırsa, sistem SFM sıfırlama nedenini "uzaktan kapatma" olarak bildirir.


Programlanan alarm eşikleri seviyelerini görüntülemek için show alarm threshold komutunu çalıştırın:.
 

E600-TAC-3#show alarms threshold

-- Temperature Limits (deg C) --
-----------------------------------------------------------
Minor Minor Off Major Major Off Shutdown
Linecard 75 70 80 77 85
RPM 65 60 75 70 80
SFM 65 60 75 70 80

Bu durumu gidermek için aşağıdaki adımları kullanın:

  1. Bir yüz plakasının, hat kartı olmadan tüm yuvaları kapladığını doğrulayın. Bu tür plakalar olmadan, beş dakika içinde yüksek sıcaklık durumu meydana gelebilir. Yedek boşluklar Force10 Networks'ten temin edilebilir.
  2. Kasanın zemine yerleştirilmediğinden emin olun. 
  3. Kasanın yakınında yeterli sayıda soğutma döşemesi olduğunu doğrulayın.
  4. Arızalı bir sensörden şüpheleniyorsanız sfm yuva numarasını sıfırla komutuyla SFM'yi uzaktan sıfırlayın. Sıcaklık gerçekten yüksekse SFM muhtemelen açılmaz ve kartın arka panele bağlanmaması ve kasanın geri kalanı için uygun hava akışına izin vermesi için birkaç santim çıkarılması gerekir.
    NOT: Bu komut yalnızca FTOS 6.5.4.0 ve üzeri sürümlerde ve E Serisinde kullanılabilir.
    NOT: SFM'yi çıkarırken dikkatli olun; 85 derece ise, dokunulamayacak kadar sıcak olabilir.
Reset sfm komutuyla etkin SFM'nin sıfırlanması trafik kesintisine ve şu mesaja neden olabilir:
Force10#reset sfm 0 
SFM 0 is active. Resetting it might temporarily impact traffic. 
Proceed with reset? Confirm [yes/no]:
 
SFM, düşük gerilim nedeniyle
 
kapatıldıGüç kesintisi durumunda genellikle önce SFM kapanır. Daha fazla ayrıntı için Düşük Güç Koşullarında Sorun Giderme adlı ayrı belgeye bakın.
Force10>show sfm 3 
Switch Fabric State: up 
-- SFM card 3 -- 
Status : power off - SFM powered off due to under-voltage 
Card Type : SFM - Switch Fabric Module 
Up Time : 0 sec 
Temperature : 33C 
Power Status : PEM0: up PEM1: up 
Serial Number : 0012632 
Part Number : 7520003706 Rev A 
Vendor Id : 01 
Date Code : 01442003

Bir TAC Vakası Açtığınızda Toplanacak Bilgiler


Force10 Networks'ün Teknik Yardım Merkezi'ne (TAC) sağlanan bilgi düzeyi, TAC'nin sağlayabileceği sorun giderme ayrıntılarını belirler.  Sınırlı bilgi kullanıldığında, TAC normalde bir hata mesajında bildirilen bir SFM'nin yeniden yerleştirilmesini ve SFM'nin yakından izlenmesini önerir. SFM tekrar başarısız olursa, daha fazla sorun giderme yardımı istemek için TAC ile iletişime geçin.  Lütfen isupport sayfasındaki Servis İsteği Oluştur formunu kullanın ve varsa aşağıdaki bilgileri ekleyin:
  • Hata mesajlarını gösteren konsol görüntüleri
  • Gerçekleştirilen sorun giderme adımlarını ve her adım sırasındaki önyükleme sırasını gösteren konsol görüntüleri
  • Kullanılıyorsa bir syslog sunucusuna kaydedilen mesajlar.
  • Show trace komutunun çıktısı
  • Show tech-support komutunun çıktısı

Cause

-

Resolution

-

Etkilenen Ürünler

Switches