ECS: xDoctor: RAP081: 증상 코드: 2048: 모든 NTP 서버가 동기화에 적합하지 않음
Summary: xDoctor가 NTP(Network Time Protocol) 데몬 문제를 감지했습니다.
Symptoms
ECS 랙의 모든 노드에는 NTP 데몬이 실행 중이어야 하며 구성된 NTP 서버는 시간을 동기화할 수 있어야 합니다. 그렇지 않으면 프런트엔드 데이터 수집에 문제가 발생할 수 있습니다.
| 증상 |
메시지 |
|---|---|
| NTP_NOT_SUITABLE_ERROR |
메시지 = 모든 NTP 서버가 동기화에 적합하지 않습니다. |
Cause
위의 증상은 24시간 이내에 발생하지 않으면 경고로 유지됩니다.
24시간 후에도 이 상태가 지속되면 심각도가 ERROR로 증가하고 RAP081이 보고됩니다.
Resolution
즉, 'Extra' 필드에 나열된 각 노드에서 NTP 서버와 동기화할 수 없습니다.
확인:
1. 나열된 각 노드에서 NTP 서버 목록을 가져옵니다.
명령:
# getrackinfo -r | 그렙 NTP
예:
admin@node1 : ~> getrackinfo -r | grep NTP
NTPServer = xxx.xxx.xxx.xxx
2. 1단계에 나열된 각 NTP 서버에 대해 시간을 동기화할 수 있는지 테스트합니다.
명령:
# sudo ntpdate -p 2 -d <NTP IP 주소/NTP FQDN>
또는
# sudo ntpdate -p 2 -d 'getrackinfo -r | grep NTP |grep -oP "(?:[0-9]{1,3}\.) {3} [0-9] {1,3}"'
예(시간 동기화 가능):
admin@node1:~> sudo ntpdate -p 2 -d xxx.xxx.xxx.xxx
22 Feb 13:47:48 ntpdate[110901]: ntpdate 4.2.8p11@1.3728-o Thu Jun 14 09:26:52 UTC 2018 (1)
호스트 <NTP IP 주소> 및 서비스 ntp
<NTP IP 주소가> NTP 호스트 이름으로>
반전 <된 호스트 위치를 찾고 있습니다. <NTP 호스트 이름>
전송(<NTP IP 주소>)
수신(<NTP IP 주소>)
전송(<NTP IP 주소)
수신(<NTP IP 주소>>)
서버 <NTP IP 주소>, 포트 123
계층 2, 정밀도 -24, 도약 00, 신뢰 000
refid [<NTP IP 주소>], 지연 0.02615, 분산 0.00003
전송 2, 필터 2
기준 시간: e01a7b0d.af9e6616 2019년 2월 22일 금요일 13:43:41.686
원래 타임스탬프: e01a7c06.748e0c65 2019년 2월 22일 금요일 13:47:50.455
타임스탬프 전송: e01a7c06.7478b000 2019년 2월 22일 금요일 13:47:50.454
필터 지연: 0.02635 0.02615 0.00000 0.00000
0.00000 0.00000 0.00000 0.00000
필터 오프셋: 0.000043 -0.00002 0.000000 0.000000
0.000000 0.000000 0.000000 0.000000
지연 0.02615, 분산 0.00003
오프셋 -0.000022
22 Feb 13:47:50 ntpdate [110901] : 시간 서버 <NTP IP 주소> 오프셋 -0.000022 초 조정
예: (출력 시간을 동기화할 수 없는 경우)
admin@node1:~> sudo ntpdate -p 2 -d xxx.xxx.xxx.xxx
22 Feb 13:47:48 ntpdate[110901]: ntpdate 4.2.8p11@1.3728-o Thu Jun 14 09:26:52 UTC 2018 (1)
호스트 <NTP IP 주소> 및 서비스 ntp
<NTP IP 주소가> NTP 호스트 이름으로>
반전 <된 호스트 위치를 찾고 있습니다. <NTP 호스트 이름>
전송(<NTP IP 주소>)전송(<NTP IP 주소>)
전송(<NTP IP 주소>)
서버 <NTP IP 주소>, 포트 123
계층 2, 정밀도 -24, 도약 00, 신뢰 000
refid [<NTP IP 주소>], 지연 0.02615, 분산 0.00003
전송 2, 필터 2
기준 시간: e01a7b0d.af9e6616 2019년 2월 22일 금요일 13:43:41.686
원래 타임스탬프: e01a7c06.748e0c65 2019년 2월 22일 금요일 13:47:50.455
타임스탬프 전송: e01a7c06.7478b000 2019년 2월 22일 금요일 13:47:50.454
필터 지연: 0.02635 0.02615 0.00000 0.00000
0.00000 0.00000 0.00000 0.00000
필터 오프셋: 0.000043 -0.00002 0.000000 0.000000
0.000000 0.000000 0.000000 0.000000
지연 0.02615, 분산 0.00003
오프셋 -0.000022
22 Feb 13:47:50 ntpdate [112232] : 동기화에 적합한 서버를 찾을 수 없습니다.
3. getrackinfo -r 결과의 NTP 섹션에 FQDN을 추가합니다.
명령:
# sudo setrackinfo -a NTPServer < NTP FQDN >
4. 정책 기반 라우팅을 통해 관리 인터페이스에서 전송된 NTP로 인해 문제가 발생할 수 있으므로 네트워크 분리 및 고정 경로를 확인합니다.
명령:
# getrackinfo -n; getrackinfo -t
예:
admin@node1:~>getrackinfo -n; getrackinfo -t
명명된 네트워크
==============
노드 ID 네트워크 IP 주소 넷마스크 게이트웨이 VLAN 인터페이스
정적 경로 목록
=================
노드 ID 네트워크 넷마스크 게이트웨이 인터페이스
5. NTP 서버가 해당 환경에서 수신 대기 중이고 종종 방화벽에서 포트를 차단하는지 확인합니다.
명령:
# sudo ntpq -c as
예: (아래에는 연결할 수 없는 NTP 서버 하나와 ACL로 인해 차단된 NTP 서버가 있습니다.)
admin@node1:~> sudo ntpq -c as
ind assid status conf reach auth condition last_event cnt
===========================================================
1 56633 8011 yes no none reject mobilize 1
6. NTP에 날짜 변경이 있는지 확인합니다.
명령:
# viprexec "date +%s" 2>&1 | grep "^15"
예:
admin@node1:~>viprexec "날짜 +%s" 2>&1 | grep "^15"
1554470147
1554470111
1554470096
1554470142 1554470144
1554470109
1554470124
1554470140
7. ntpd 서비스 상태를 확인한 후 서비스를 재시작합니다. (상태가 실행 중이더라도 재시작을 진행합니다.)
참고: ntpd.service는 영향을 주지 않는 서비스입니다.
명령:
# viprexec systemctl status ntpd.service | grep Active:
예:
admin@node1:~> viprexec systemctl status ntpd.service | grep Active:
활성: 2019-08-06 화요일 02:49:06 UTC부터 활성 (실행 중); 1 일 18 시간 전
활성 : 활성 (실행 중) 화 2019-08-06 02:49:07 UTC 이후, 1 일 18 시간 전
활성 : 활성 (실행 중) 이후 수요일 2019-08-07 20:13:27 UTC, 58 분 전
활성 : 활성 (실행 중) 화 2019-08-06 02:49:06 UTC 부터 1 일 18 시간 전
활성 : 활성 (실행 중) 화 2019-08-06 02:49:07 UTC 이후; 1 일 18 시간 전
활성 : 활성 (실행 중) 화 2019-08-06 02:49:07 UTC 부터 1 일 18 시간 전
활성 : 2019-08-06 화 02:49:07 UTC부터 활성 (실행 중); 1일 18시간 전
활성: 2019-08-06 화요일 02:49:07 UTC 이후 활성(실행 중), 1일 18시간 전
명령:
# viprexec systemctl restart ntpd.service
예:
admin@node1:~> viprexec systemctl restart ntpd.service
호스트에서 출력: 192.168.219.8
호스트에서 출력: 192.168.219.7
호스트의 출력: 192.168.219.6
호스트에서 출력: 192.168.219.4
호스트의 출력: 192.168.219.3
호스트에서 출력: 192.168.219.2
호스트에서 출력: 192.168.219.5
호스트에서 출력 : 192.168.219.1
8. 모든 노드에서 md5sum ntp.conf 파일을 확인합니다.
명령:
# viprexec "sudo md5sum /etc/ntp.conf"
예:
admin@node1:~> viprexec "sudo md5sum /etc/ntp.conf"
호스트에서 출력: 192.168.219.2
741f0abb12ac82a21f150004bd407334 /etc/ntp.conf
호스트에서 출력: 192.168.219.5
741f0abb12ac82a21f150004bd407334 /etc/ntp.conf
호스트에서 출력: 192.168.219.4
741f0abb12ac82a21f150004bd407334 /etc/ntp.conf
호스트에서 출력: 192.168.219.1
7da6eb8009abc18ed1875f1f15ade72a /etc/ntp.conf
호스트에서 출력: 192.168.219.3
741f0abb12ac82a21f150004bd407334 /etc/ntp.conf
호스트에서 출력: 192.168.219.8
741f0abb12ac82a21f150004bd407334 /etc/ntp.conf
호스트에서 출력: 192.168.219.6
741f0abb12ac82a21f150004bd407334 /etc/ntp.conf
호스트에서 출력: 192.168.219.7
741f0abb12ac82a21f150004bd407334 /etc/ntp.conf
참고: 이는 공용 및 관리 인터페이스가 있고 노드가 마지막으로 제공된 구성에 따라 모두 공개되지 않도록 구성되어 있기 때문일 수 있습니다. 이전 버전의 ECS에서는 한 노드가 유효하고 나머지 노드가 방화벽 뒤에 있는 것처럼 보이는 경우 PBR이 중단될 수 있습니다.
9. getrackinfo -r 결과의 ns_mgmt에 123을 추가한 다음 NTP가 전송 및 수신을 시작했는지 확인합니다.
명령:
# sudo setrackinfo -a ns_mgmt 123
예:
admin@node1:~>sudo setrackinfo -a ns_mgmt 123
오류가 계속되면 포트 123을 다시 공용 인터페이스에 배치하고 동기화를 다시 확인합니다.
명령:
# sudo setrackinfo -d ns_mgmt 123
예:
admin@node1:~> sudo setrackinfo -d ns_mgmt 123
위의 각 단계를 수행한 후 NTP 동기화 상태를 확인합니다.
해상도:
이는 구성된 서버가 NTP 서버가 아니거나 예상대로 작동하지 않음을 의미합니다. NTP 문제를 해결하려면 고객의 네트워크 팀이 참여해야 합니다.
Additional Information
'NTP daemon not running'(NTPD_NOT_RUNNING) 증상은 다음 기술 자료 문서를 참조하십시오.
ECS: xDoctor: RAP081: 증상 코드: 2048: NTP 데몬이 실행되지
않음'All NTP servers adjust an offset higher than the error threshold'(NTP_ERROR_OFFSET_ERROR) 증상은 기술 자료 문서
ECS: xDoctor: RAP081: 증상 코드: 2048: 모든 NTP 서버는 오류 임계값
보다 높은 오프셋을 조정합니다'System time difference above ERROR Threshold' 증상은 기술 자료 문서
ECS: xDoctor: RAP081: 증상 코드: 2048: ERROR 임계값을 초과하는 시스템 시간 차이