ECS: xDoctor: RAP081: 증상 코드: 2048: 모든 NTP 서버가 동기화에 적합하지 않음

Summary: xDoctor가 NTP(Network Time Protocol) 데몬 문제를 감지했습니다.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

ECS 랙의 모든 노드에는 NTP 데몬이 실행 중이어야 하며 구성된 NTP 서버는 시간을 동기화할 수 있어야 합니다. 그렇지 않으면 프런트엔드 데이터 수집에 문제가 발생할 수 있습니다.

증상

메시지

NTP_NOT_SUITABLE_ERROR

메시지 = 모든 NTP 서버가 동기화에 적합하지 않습니다.
추가 = [노드 목록]

Cause

위의 증상은 24시간 이내에 발생하지 않으면 경고로 유지됩니다.
24시간 후에도 이 상태가 지속되면 심각도가 ERROR로 증가하고 RAP081이 보고됩니다.

Resolution

즉, 'Extra' 필드에 나열된 각 노드에서 NTP 서버와 동기화할 수 없습니다.

확인:
1. 나열된 각 노드에서 NTP 서버 목록을 가져옵니다.

명령:

# getrackinfo -r | 그렙 NTP

예:

admin@node1 : ~> getrackinfo -r | grep NTP
NTPServer = xxx.xxx.xxx.xxx

2. 1단계에 나열된 각 NTP 서버에 대해 시간을 동기화할 수 있는지 테스트합니다.

명령:

# sudo ntpdate -p 2 -d <NTP IP 주소/NTP FQDN>

또는

# sudo ntpdate -p 2 -d 'getrackinfo -r | grep NTP |grep -oP "(?:[0-9]{1,3}\.) {3} [0-9] {1,3}"'

(시간 동기화 가능):

admin@node1:~> sudo ntpdate -p 2 -d xxx.xxx.xxx.xxx
22 Feb 13:47:48 ntpdate[110901]: ntpdate 4.2.8p11@1.3728-o Thu Jun 14 09:26:52 UTC 2018 (1)
호스트 <NTP IP 주소> 및 서비스 ntp
<NTP IP 주소가> NTP 호스트 이름으로>
반전 <된 호스트 위치를 찾고 있습니다. <NTP 호스트 이름>
전송(<NTP IP 주소>)
수신(<NTP IP 주소>)
전송(<NTP IP 주소)
수신(<NTP IP 주소>>)
서버 <NTP IP 주소>, 포트 123
계층 2, 정밀도 -24, 도약 00, 신뢰 000
refid [<NTP IP 주소>], 지연 0.02615, 분산 0.00003
전송 2, 필터 2
기준 시간:    e01a7b0d.af9e6616 2019년 2월 22일 금요일 13:43:41.686
원래 타임스탬프: e01a7c06.748e0c65 2019년 2월 22일 금요일 13:47:50.455
타임스탬프 전송:  e01a7c06.7478b000 2019년 2월 22일 금요일 13:47:50.454
필터 지연:  0.02635 0.02615 0.00000 0.00000
0.00000 0.00000 0.00000 0.00000
필터 오프셋: 0.000043 -0.00002 0.000000 0.000000
0.000000 0.000000 0.000000 0.000000
지연 0.02615, 분산 0.00003
오프셋 -0.000022

22 Feb 13:47:50 ntpdate [110901] : 시간 서버 <NTP IP 주소> 오프셋 -0.000022 초 조정

예: (출력 시간을 동기화할 수 없는 경우)

admin@node1:~> sudo ntpdate -p 2 -d xxx.xxx.xxx.xxx
22 Feb 13:47:48 ntpdate[110901]: ntpdate 4.2.8p11@1.3728-o Thu Jun 14 09:26:52 UTC 2018 (1)
호스트 <NTP IP 주소> 및 서비스 ntp
<NTP IP 주소가> NTP 호스트 이름으로>
반전 <된 호스트 위치를 찾고 있습니다. <NTP 호스트 이름>
전송(<NTP IP 주소>)전송(<NTP IP 주소>)

전송(<NTP IP 주소>)

서버 <NTP IP 주소>, 포트 123
계층 2, 정밀도 -24, 도약 00, 신뢰 000
refid [<NTP IP 주소>], 지연 0.02615, 분산 0.00003
전송 2, 필터 2
기준 시간:    e01a7b0d.af9e6616 2019년 2월 22일 금요일 13:43:41.686
원래 타임스탬프: e01a7c06.748e0c65 2019년 2월 22일 금요일 13:47:50.455
타임스탬프 전송:  e01a7c06.7478b000 2019년 2월 22일 금요일 13:47:50.454
필터 지연:  0.02635 0.02615 0.00000 0.00000
0.00000 0.00000 0.00000 0.00000
필터 오프셋: 0.000043 -0.00002 0.000000 0.000000
0.000000 0.000000 0.000000 0.000000
지연 0.02615, 분산 0.00003
오프셋 -0.000022

22 Feb 13:47:50 ntpdate [112232] : 동기화에 적합한 서버를 찾을 수 없습니다.

3. getrackinfo -r 결과의 NTP 섹션에 FQDN을 추가합니다.

명령:

# sudo setrackinfo -a NTPServer < NTP FQDN >

4. 정책 기반 라우팅을 통해 관리 인터페이스에서 전송된 NTP로 인해 문제가 발생할 수 있으므로 네트워크 분리 및 고정 경로를 확인합니다.

명령:

# getrackinfo -n; getrackinfo -t

예:

admin@node1:~>getrackinfo -n; getrackinfo -t
명명된 네트워크
==============
노드 ID 네트워크 IP 주소 넷마스크 게이트웨이 VLAN 인터페이스
정적 경로 목록
=================
노드 ID 네트워크 넷마스크 게이트웨이 인터페이스

5. NTP 서버가 해당 환경에서 수신 대기 중이고 종종 방화벽에서 포트를 차단하는지 확인합니다. 

명령:

# sudo ntpq -c as

예: (아래에는 연결할 수 없는 NTP 서버 하나와 ACL로 인해 차단된 NTP 서버가 있습니다.)

admin@node1:~> sudo ntpq -c as
ind assid status conf reach auth condition last_event cnt
===========================================================
1 56633 8011 yes no none reject mobilize 1

6. NTP에 날짜 변경이 있는지 확인합니다. 

명령:

# viprexec "date +%s" 2>&1 | grep "^15"

예:

admin@node1:~>viprexec "날짜 +%s" 2>&1 | grep "^15"
1554470147
1554470111
1554470096
1554470142 1554470144

1554470109
1554470124
1554470140

7. ntpd 서비스 상태를 확인한 후 서비스를 재시작합니다. (상태가 실행 중이더라도 재시작을 진행합니다.) 
참고: ntpd.service는 영향을 주지 않는 서비스입니다.

명령:

# viprexec systemctl status ntpd.service | grep Active:

예:

admin@node1:~> viprexec systemctl status ntpd.service | grep Active:
   활성: 2019-08-06 화요일 02:49:06 UTC부터 활성 (실행 중); 1 일 18 시간 전
활성 : 활성 (실행 중) 화 2019-08-06 02:49:07 UTC 이후, 1 일 18 시간 전
활성 : 활성 (실행 중) 이후 수요일 2019-08-07 20:13:27 UTC, 58 분 전
활성 : 활성 (실행 중) 화 2019-08-06 02:49:06 UTC 부터 1 일 18 시간 전
활성 : 활성 (실행 중) 화 2019-08-06 02:49:07 UTC 이후; 1 일 18 시간 전
활성 : 활성 (실행 중) 화 2019-08-06 02:49:07 UTC 부터 1 일 18 시간 전
활성 : 2019-08-06 화 02:49:07 UTC부터 활성 (실행 중); 1일 18시간 전
활성: 2019-08-06 화요일 02:49:07 UTC 이후 활성(실행 중), 1일 18시간 전

명령: 

# viprexec systemctl restart ntpd.service

예:

admin@node1:~> viprexec systemctl restart ntpd.service
호스트에서 출력: 192.168.219.8
호스트에서 출력: 192.168.219.7
호스트의 출력: 192.168.219.6
호스트에서 출력: 192.168.219.4
호스트의 출력: 192.168.219.3
호스트에서 출력: 192.168.219.2
호스트에서 출력: 192.168.219.5
호스트에서 출력 : 192.168.219.1

8. 모든 노드에서 md5sum ntp.conf 파일을 확인합니다.

명령:

# viprexec "sudo md5sum /etc/ntp.conf"

예:

admin@node1:~> viprexec "sudo md5sum /etc/ntp.conf"

호스트에서 출력: 192.168.219.2
741f0abb12ac82a21f150004bd407334 /etc/ntp.conf

호스트에서 출력: 192.168.219.5
741f0abb12ac82a21f150004bd407334 /etc/ntp.conf

호스트에서 출력: 192.168.219.4
741f0abb12ac82a21f150004bd407334 /etc/ntp.conf

호스트에서 출력: 192.168.219.1
7da6eb8009abc18ed1875f1f15ade72a /etc/ntp.conf

호스트에서 출력: 192.168.219.3
741f0abb12ac82a21f150004bd407334 /etc/ntp.conf

호스트에서 출력: 192.168.219.8
741f0abb12ac82a21f150004bd407334 /etc/ntp.conf

호스트에서 출력: 192.168.219.6
741f0abb12ac82a21f150004bd407334 /etc/ntp.conf

호스트에서 출력: 192.168.219.7
741f0abb12ac82a21f150004bd407334 /etc/ntp.conf

참고: 이는 공용 및 관리 인터페이스가 있고 노드가 마지막으로 제공된 구성에 따라 모두 공개되지 않도록 구성되어 있기 때문일 수 있습니다. 이전 버전의 ECS에서는 한 노드가 유효하고 나머지 노드가 방화벽 뒤에 있는 것처럼 보이는 경우 PBR이 중단될 수 있습니다.

9. getrackinfo -r 결과의 ns_mgmt에 123을 추가한 다음 NTP가 전송 및 수신을 시작했는지 확인합니다.

명령:

# sudo setrackinfo -a ns_mgmt 123

예:

admin@node1:~>sudo setrackinfo -a ns_mgmt 123

오류가 계속되면 포트 123을 다시 공용 인터페이스에 배치하고 동기화를 다시 확인합니다.

명령:

# sudo setrackinfo -d ns_mgmt 123

예:

admin@node1:~> sudo setrackinfo -d ns_mgmt 123

위의 각 단계를 수행한 후 NTP 동기화 상태를 확인합니다.

해상도:
이는 구성된 서버가 NTP 서버가 아니거나 예상대로 작동하지 않음을 의미합니다. NTP 문제를 해결하려면 고객의 네트워크 팀이 참여해야 합니다.

Additional Information

위의 해결 방법으로 문제가 해결되지 않으면 고객의 네트워크 팀에 문의하여 NTP 문제를 해결해야 합니다.

'NTP daemon not running'(NTPD_NOT_RUNNING) 증상은 다음 기술 자료 문서를 참조하십시오.
ECS: xDoctor: RAP081: 증상 코드: 2048: NTP 데몬이 실행되지

않음'All NTP servers adjust an offset higher than the error threshold'(NTP_ERROR_OFFSET_ERROR) 증상은 기술 자료 문서
ECS: xDoctor: RAP081: 증상 코드: 2048: 모든 NTP 서버는 오류 임계값

보다 높은 오프셋을 조정합니다'System time difference above ERROR Threshold' 증상은 기술 자료 문서
ECS: xDoctor: RAP081: 증상 코드: 2048: ERROR 임계값을 초과하는 시스템 시간 차이

Affected Products

ECS

Products

ECS Appliance, ECS Appliance Gen 1, ECS Appliance Gen 2, ECS Appliance Gen 3, ECS Software
Article Properties
Article Number: 000230633
Article Type: Solution
Last Modified: 03 Oct 2024
Version:  2
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.