ECS: RAP154: 회귀로 인해 3.8.0.1의 crontab에서 pmon 항목이 누락됨

요약: ECS 3.8.0.1 GA(General Availability)로 설치되거나 업그레이드된 시스템의 경우 pmon이 crontab에서 실행되도록 예약되지 않습니다.

이 문서는 다음에 적용됩니다. 이 문서는 다음에 적용되지 않습니다. 이 문서는 특정 제품과 관련이 없습니다. 모든 제품 버전이 이 문서에 나와 있는 것은 아닙니다.

증상

  • 노드의 부하가 높고 준비되지 않은 DT가 관찰됨

원인

  • ECS 3.8.0.1 GA(General Availability) 릴리스에서 crontab에서 pmon 항목이 누락되었습니다.
  • pmon 서비스는 우선 순위가 낮은 서비스를 재시작해야 합니다. Crontab은 예약된 서비스를 실행할 책임이 있습니다.
  • pmon 서비스가 예약된 방식으로 시작되지 않으면 노드에서 서비스 문제가 발생할 수 있습니다.

해결

참고:

  • 2023년 2월 2일에 릴리스된 ECS 3.8.0.1 GP1(General Patch 1)은 이 문제의 영향을 받지 않으며 GP1 패치의 업그레이드/설치 후 아래 단계를 적용할 필요가 없습니다.
  • 이 절차는 모든 VDC(Virtual Data Center)에서 별도로 실행되어야 합니다. 
  • ECS 3.8.0.1 GA에서 VDC에서 랙 확장을 수행하는 경우 새 랙에서 이러한 단계를 따라야 합니다. 
  • 어떤 이유로든 xDoctor를 랙에서 제거하면 구성이 손실되고 다음 단계를 다시 적용해야 합니다. 
단계:
  1. CLI를 사용하여 로깅하고 다음 명령을 실행하여 ECS 버전 및 xDoctor 버전을 확인합니다.
    Command:
    # svc_version -x
    
    Expected Output Similar To:
    svc_version v1.4.5 (svc_tools v2.8.0)                 Started 2023-01-23 04:35:25
    
    
    ECS Version:                3.8.0.1 GA (DARE)
    
    Object Version              3.8.0.1-138598.3d5db7c96f2
    OS Version                  3.8.0.0-2076.a7e36fa.36       Fabric Version              3.8.0.0-4343.878ca95
    
    Fabric-agent Version        3.8.0.0-4343.878ca95          Syslog Version              <Unknown>
    Zookeeper Version           3.8.0.0-119.78667ce           Registry Version            2.3.1.0-82.c8163d2
    Utilities Version           3.8.0.0-4343.878ca95          Service Console Version     8.0.0.0-22206.f9c9f74a6c
    xDoctor Version             4.8-87.0                      svc_tools Version           2.8.0
  2. ECS 버전의 경우:
    1. 버전이 "3.8.0.1 GA" 이외의 버전인 경우(예: "3.8.0.1 GP1" 또는 "ECS 3.8.0.1 IP") 나머지 KB를 따를 필요가 없습니다. 출력이 "3.8.0.1 GA"인 경우에만 KB를 따릅니다.
    2. 페더레이션의 모든 VDC(예: 동일한 복제 그룹의 VDC 부분)가 동일한 버전이어야 합니다. 그렇지 않은 경우 지원 부서에서 케이스를 엽니다. 
  3. xDoctor 버전의 경우: 버전이 4.8-89.0 미만인 경우 다음과 같이 xDoctor를 업그레이드해야 합니다.
    1. Dell 지원 사이트에 로그인하고 상단 검색 표시줄을 사용하여 xDoctor를 검색합니다.
    2. xDoctor 코드 및 xDoctor 릴리스 노트를 다운로드하려면 다음을 수행합니다. 페이지 왼쪽의 "Resources" 섹션에서 "Downloads & Drivers"를 클릭하면 최신 xDoctor 버전 xDoctor4ECS 4.8-xx가 릴리스 노트와 함께 다운로드할 수 있습니다. 
    3. "다운로드 및 드라이버"에서 xDoctor 릴리스 노트를 사용할 수 없는 경우 페이지 왼쪽의 "Resources" 섹션에서 "Manuals &Documents"를 클릭하면 "xDoctor Release Notes 4.8-xx"가 다운로드됩니다. 다운로드한 해당 xDoctor 버전에 대한 릴리스 노트를 선택합니다. 
  4. 랙의 개수를 확인합니다. 랙이 두 번 이상 있는 경우 각 랙에 다음 단계를 적용해야 합니다. 이 작업은 각 랙에 대해 169.254.x.1 IP에 연결하여 수행됩니다. 
    Command:
    # getclusterinfo
    
    Example of a single-rack VDC:
    Registered Racks
    ================
    Ip Address        epoxy   seg mac             seg color    seg id    NAN Hostname
    ===============   =====   =================   ==========   =======   ============
    169.254.1.1       False   AA:BB:CC:DD:EE:FF   red          1         provo-red.nanlocal
    
    Example of a two-rack VDC:
    Registered Racks
    ================
    Ip Address        epoxy   seg mac             seg color    seg id    NAN Hostname
    ===============   =====   =================   ==========   =======   ============
    169.254.1.1       False   AA:BB:CC:DD:EE:FF   red          1         provo-red.nanlocal
    169.254.2.1       False   AA:BB:CC:DD:EE:00   green        2         provo-green.nanlocal
  5. xDoctor를 버전 4.8-89 이상으로 업그레이드한 후:
    1.  xDoctor 구성 메뉴로 이동합니다.
    2. "7"을 입력하여 "Autofixes"를 선택합니다.
    3. "1"을 입력하여 "Change Autofix Status"를 선택합니다.
    4. "enable time_zone? [예]" 키를 누르고 값을 입력하지 않고 Enter 키를 눌러 기본 "예"를 유지합니다.
    5. "enable pmon_crontab_check? [아니요]", "y" 또는 "yes"를 입력한 다음 Enter 키를 눌러 pmon 문제에 대한 Autofix를 활성화합니다. 
    6. 두 옵션이 모두 "Enabled"로 표시되는지 확인합니다.
    7. "새 설정 문제"의 경우  [아니요]", "y" 또는 "Yes"를 입력하고 Enter 키를 누릅니다. 
    8. "7"을 입력하여 "Autofixes"를 선택합니다.
      Command
      # sudo xdoctor --config
      
      Expected Output Similar To:
      admin@provo-orchid:~> sudo xdoctor --config
      
      ┌────────────────────────────┐
      │ xDoctor Configuration Menu │
      └───┬────────────────────────┘
      ┌───┼──────────┐
      │ 1 │ Overview │
      └───┼──────────┘
      ┌───┼────────────────────┐
      │ 2 │ Event Notification │
      └───┼────────────────────┘
      ┌───┼─────────────┐
      │ 3 │ Auto Update │
      └───┼─────────────┘
      ┌───┼────────────────┐
      │ 4 │ Data Scrubbing │
      └───┼────────────────┘
      ┌───┼─────────────────────┐
      │ 5 │ ECS API Credentials │
      └───┼─────────────────────┘
      ┌───┼───────────────┐
      │ 6 │ IPMI Analysis │
      └───┼───────────────┘
      ┌───┼───────────┐
      │ 7 │ Autofixes │
      └───┼───────────┘
          │
      ┌───┼──────┐
      │ 0 │ Exit │
      └───┴──────┘
      
      Please make a choice: 7
      ┌───────────┐
      │ Autofixes │
      └───┬───────┘
      ┌───┼───────────────────────┐
      │ 1 │ Change Autofix Status │
      └───┼───────────────────────┘
          │ time_zone                        = Enabled
          │ pmon_crontab_check               = Disabled
         │
      ┌───┼───────────┐
      │ 0 │ Main Menu │
      └───┴───────────┘
      
      Please make a choice: 1
      
      Enable time_zone?  [Yes]: <Leave blank by pressing Enter>
      Enable pmon_crontab_check?  [No]: y
      
      New Autofix settings:
      │ pmon_crontab_check               = Enabled
      │ time_zone                        = Enabled
      
      
      > Issue new Settings?  [No]: y
      2023-02-06 13:04:31,693: xDoctor_4.8-89.0 - INFO    : Autofix Settings saved and distributed ...
      
      [**] Or temporary for one session only:
      
  6. 다음 명령을 실행하여 구성된 자동 수정을 시작합니다. 다음 단계에서 사용할 끝부분에 있는 "Session Report" 출력에 유의하십시오.
    Command:
    # sudo xdoctor --rap=RAP154 --autofix=pmon_crontab_check
    
    Expected Output Similar To:
    admin@provo-orchid:~> sudo xdoctor --rap=RAP154 --autofix=pmon_crontab_check
    
    2023-02-06 13:09:32,115: xDoctor_4.8-89.0 - INFO    : Initializing xDoctor v4.8-89.0 ...
    2023-02-06 13:09:32,323: xDoctor_4.8-89.0 - INFO    : Removing orphaned session - session_1675433645.103
    2023-02-06 13:09:32,324: xDoctor_4.8-89.0 - INFO    : Starting xDoctor session_1675688971.893 ... (SYSTEM)
    2023-02-06 13:09:32,324: xDoctor_4.8-89.0 - INFO    : Primary Node Control Check ...
    2023-02-06 13:09:32,414: xDoctor_4.8-89.0 - INFO    : xDoctor Composition - Analyzer(s):ac_pmon_crontab_check
    …
    2023-02-06 13:09:35,984: xDoctor_4.8-89.0 - INFO    : --------------------
    2023-02-06 13:09:35,985: xDoctor_4.8-89.0 - INFO    : Diagnosis Summary
    2023-02-06 13:09:35,985: xDoctor_4.8-89.0 - INFO    : --------------------
    2023-02-06 13:09:35,985: xDoctor_4.8-89.0 - INFO    : PSNT: Unknown
    2023-02-06 13:09:35,985: xDoctor_4.8-89.0 - INFO    : --------------------
    2023-02-06 13:09:35,985: xDoctor_4.8-89.0 - INFO    : FIXED             =  1
    2023-02-06 13:09:35,985: xDoctor_4.8-89.0 - INFO    : CRITICAL          =  0
    2023-02-06 13:09:35,985: xDoctor_4.8-89.0 - INFO    : CRITICAL (CACHED) =  0
    2023-02-06 13:09:35,985: xDoctor_4.8-89.0 - INFO    : ERROR             =  0
    2023-02-06 13:09:35,985: xDoctor_4.8-89.0 - INFO    : ERROR (CACHED)    =  0
    2023-02-06 13:09:35,985: xDoctor_4.8-89.0 - INFO    : WARNING           =  0
    2023-02-06 13:09:35,985: xDoctor_4.8-89.0 - INFO    : INFO              =  0
    2023-02-06 13:09:35,985: xDoctor_4.8-89.0 - INFO    : VERBOSE           =  0
    2023-02-06 13:09:35,985: xDoctor_4.8-89.0 - INFO    : REPORT            =  0
    …
    2023-02-06 13:09:35,990: xDoctor_4.8-89.0 - INFO    : ----------------
    2023-02-06 13:09:35,991: xDoctor_4.8-89.0 - INFO    : Session Report - xdoctor --report --archive=2023-02-06_130932
    2023-02-06 13:09:35,991: xDoctor_4.8-89.0 - INFO    : ----------------
  7. 이전 단계의 "세션 보고서"를 사용하여 아래 강조 표시된 대로 상태가 수정되었는지 확인합니다.
    Command:
    # sudo xdoctor --report --archive=<Session Report output>
    
    Expected Output Similar To:
    admin@provo-test1:~> sudo xdoctor --report --archive=2023-02-06_130932
    
    xDoctor 4.8-89.0
    FNM00123456789 - ECS 3.8.0.1
    
    Displaying xDoctor Report (2023-02-06_130932) Filter:[] ...
    
    ----------------------------------------------------------------------------
    FIXED - Updated the object-main crontab to include pmon on one or more nodes
    ----------------------------------------------------------------------------
    Node      = Nodes
    Extra     = {'Nodes': ['169.254.10.1']}
    Timestamp = 2023-02-06_130932
    PSNT      = FNM00123456789 @ 4.8-89.

     

해당 제품

ECS, ECS Appliance
문서 속성
문서 번호: 000208138
문서 유형: Solution
마지막 수정 시간: 25 5월 2023
버전:  12
다른 Dell 사용자에게 질문에 대한 답변 찾기
지원 서비스
디바이스에 지원 서비스가 적용되는지 확인하십시오.