Connectrix: Cisco:수퍼바이저 모듈의 okButDiagFailed 및 show tech-support 세부 정보를 수집할 수 없습니다.

요약: 감독자 모듈 상태가 HA-Standby이지만 DIAG 장애 이상으로 NFDC에서 오류가 스트리밍되고 있었습니다.

이 문서는 다음에 적용됩니다. 이 문서는 다음에 적용되지 않습니다. 이 문서는 특정 제품과 관련이 없습니다. 모든 제품 버전이 이 문서에 나와 있는 것은 아닙니다.

증상

이 문제를 조사하기 위해 스위치 로그를 수집하는 데 단점이 있었고 TMP 폴더가 가득 찼습니다. 

Show tech details will take 4-8 minutes to complete. Please Wait ...
Collecting show-tech at Tue Nov  5 09:35:02 2024

---- Show of Part 0 Completed ----

---- Show of Part 1 Completed ----

---- Show of Part 2 Completed ----

---- Show of Part 3 Completed ----

RSFP-DBG: Total Time Taken = 0s

RSFP-DBG: ID 00 PID 30420 30420: 0s

RSFP-DBG: ID 01 PID 30421 30421: 0s

RSFP-DBG: ID 02 PID 30422 30422: 0s

RSFP-DBG: ID 03 PID 30423 30423: 0s
Done collecting show-tech at Tue Nov  5 09:35:02 2024

############Collecting Data from Line=cards###########
/isan/bin/tcap_bash_nounzip: line 18: cannot create temp file for here-document: No space left on device
/isan/bin/tcap_bash_nounzip: line 18: cannot create temp file for here-document: No space left on device
/isan/bin/tcap_bash_nounzip: line 18: cannot create temp file for here-document: No space left on device

 

+ Var 온도가 100%로 가득 찼습니다.

 

show system internal flash
df: write error: No space left on device
Mount-on                  1K-blocks      Used   Available   Use%  Filesystem


show system internal dir /var/tmp
                                                                ./     1536040
                                                               ../         380
                                                 cfg_status.log_1            0
                               esrs_curl_response_155235395781085            0
                               esrs_http_response_155235395781085            1
                               esrs_curl_response_222655613294187            0
                               esrs_http_response_222655613294187            1
                               esrs_curl_response_102722484048004            1
                               esrs_http_response_102722484048004            1
                               esrs_curl_response_234654123105028            1
                               esrs_http_response_234654123105028            1
                               esrs_curl_response_234154112134614            1
                               esrs_http_response_234154112134614            1
                               esrs_curl_response_115721101643319            1
                               esrs_http_response_115721101643319            1
                               esrs_curl_response_010652840900059            1
                               esrs_http_response_010652840900059            1
                               esrs_curl_response_010152761078453            1
                               esrs_http_response_010152761078453            1
                               esrs_curl_response_005652696830477            1
                               esrs_http_response_005652696830477            1

 

유사한 문제가 발견되면 Dell 지원 부서에 문의하여 Cisco에서 DPlug를 가져오고 로그를 수집할 TMP 공간을 비웁니다. 

++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
 

로그가 수집되면 errDisabled 테스트로 인해 모듈에 BIOS 오류가 표시되었음을 발견했습니다.

exception information --- exception instance 7 ----
Module Slot Number: 4
Device Id         : 0
Device Name       : undef
Device Errorcode  : 0x00000000
Device ID         : 00 (0x00)
Device Instance   : 00 (0x00)
Dev Type (HW/SW)  : 00 (0x00)
ErrNum (devInfo)  : 00 (0x00)
System Errorcode  : 0x40710022 BIOS file write error 
Error Type        : Warning
PhyPortLayer      : 0x0
Port(s) Affected  : 
Error Description : Secondary BootROM test failed
DSAP              : 0 (0x0)
UUID              : 483 (0x1e3)
Time              : Sat Mar  9 11:05:18 2024
                    (Ticks: 65EC345E jiffies) 

2024 Feb 23 14:57:32 OSL-D1-9706-31-Fabric2 %PORT-5-IF_UP: %$VSAN 100%$ Interface fc1/15 is up in mode F   
2024 Mar  9 11:05:18 OSL-D1-9706-31-Fabric2 %DIAGCLIENT-2-EEM_ACTION_HM_SHUTDOWN: Test <PrimaryBootROM> has been disabled as a part of default EEM action
2024 Mar  9 11:05:18 OSL-D1-9706-31-Fabric2 %DEVICE_TEST-2-PRIMARY_BOOTROM_FAIL: Module 4 has failed test PrimaryBootROM 20 times on device Primary BootROM due to error BIOS file write error
2024 Mar  9 11:05:18 OSL-D1-9706-31-Fabric2 %MODULE-4-MOD_WARNING: Module 4 (Serial number: JAE22290BR9) reported warning 4/1-4/0 due to BIOS file write error in device DEV_UNDEF (device error 0x0)
2024 Mar  9 11:05:18 OSL-D1-9706-31-Fabric2 %DIAGCLIENT-2-EEM_ACTION_HM_SHUTDOWN: Test <SecondaryBootROM> has been disabled as a part of default EEM action
2024 Mar  9 11:05:18 OSL-D1-9706-31-Fabric2 %DEVICE_TEST-2-SECONDARY_BOOTROM_FAIL: Module 4 has failed test SecondaryBootROM 20 times on device Secondary BootROM due to error BIOS file write error
2024 Mar  9 11:05:18 OSL-D1-9706-31-Fabric2 %CALLHOME-2-EVENT: MODULE_WARNING
2024 Mar  9 11:05:18 OSL-D1-9706-31-Fabric2 %MODULE-4-MOD_WARNING: Module 4 (Serial number: JAE22290BR9) reported warning 4/1-4/0 due to BIOS file write error in device DEV_UNDEF (device error 0x0)
2024 Mar  9 11:05:18 OSL-D1-9706-31-Fabric2 %CALLHOME-2-EVENT: GOLD-minor

원인

errDisabled 테스트로 인해 모듈에 BIOS 오류가 표시되었습니다.

해결

BIOS 테스트를 실행하여 모듈 상태를 수정합니다.

# show system verify bios flash 0
# show system verify bios flash 1

#diagnostic clear result module 4 test 5
#diagnostic clear result module 4 test 6

# diagnostic start module 4 test 5
# diagnostic start module 4 test 6

# diagnostic stop module 4 test 5
# diagnostic stop module 4 test 6

#show diagnostic result module 4  detail 
#show module
 
# show module
Mod  Online Diag Status
---  ------------------
1    Pass
2    Pass
3    Pass
4    Pass <<<<<<<<
5    Pass

해당 제품

Connectrix MDS-9706, Connectrix MDS-9706-V2
문서 속성
문서 번호: 000289853
문서 유형: Solution
마지막 수정 시간: 27 2월 2025
버전:  1
다른 Dell 사용자에게 질문에 대한 답변 찾기
지원 서비스
디바이스에 지원 서비스가 적용되는지 확인하십시오.