VNX: 복제 루트 체크포인트가 손상/비활성 상태일 때 복제 정리(사용자 수정 가능)
Summary: 복제 루트 체크포인트가 손상/비활성 상태일 때 복제 정리(사용자 수정 가능)
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
루트 체크포인트가 손상되었습니다(일반적인 이유는 디스크 장애로 인해 백엔드 LUN에 수정 불가능이 있기 때문임)
위 출력에서는 루트 체크포인트만 볼 수 있으며 이는 기본 파일 시스템이 양호함을 나타냅니다. 이 문제는 일반적으로 savvol이 손상된 다른 스토리지 풀에 구축되어 있고 연결된 파일 시스템이 안전한 경우에 발생합니다.
[nasadmin@CS0 ~]$ server_mount ALL | grep unmount root_rep_ckpt_28_242474_1 on /root_rep_ckpt_28_242474_1 ckpt,perm,ro,<unmounted> root_rep_ckpt_28_242474_2 on /root_rep_ckpt_28_242474_2 ckpt,perm,ro,<unmounted> root_rep_ckpt_27_242517_1 on /root_rep_ckpt_27_242517_1 ckpt,perm,ro,<unmounted> root_rep_ckpt_27_242517_2 on /root_rep_ckpt_27_242517_2 ckpt,perm,ro,<unmounted>
위 출력에서는 루트 체크포인트만 볼 수 있으며 이는 기본 파일 시스템이 양호함을 나타냅니다. 이 문제는 일반적으로 savvol이 손상된 다른 스토리지 풀에 구축되어 있고 연결된 파일 시스템이 안전한 경우에 발생합니다.
[nasadmin@CS0 ~]$ nas_replicate -l Name Type Local Mover Interconnect Celerra Status rep_fs1 filesystem server_2 -->Replication Remote_CS Critical 8865448248:The replication session encountered an error that halted progress. rep_fs2 filesystem server_2 -->Replication Remote_CS OK rep_fs3 filesystem server_2 -->Replication Remote_CS Critical 8865448248:The replication session encountered an error that halted progress.위의 출력은 2개의 복제 심각한 오류(server_mount 출력에 표시된 2개의 루트 체크포인트 마운트 해제 상태 세트와 일치)에서 명백한 오류를 반영합니다.
Cause
Data Mover에 패닉이 발생하는 경우 대부분의 경우 디스크 손상으로 인해 발생하며 VNX는 파일 시스템을 손상된 것으로 표시합니다. 루트 체크포인트도 마운트 해제됩니다.
Resolution
참고: 디스크를 교체해야 하는 경우와 같이 백엔드 문제를 먼저 해결해야 합니다.
영향을 받는 복제를 삭제하려면 다음과 같이 합니다.
세션 삭제를 직접 시도하는 경우 삭제 작업이 중단된 것으로 나타날 수 있습니다. 삭제는 루트 체크포인트를 업데이트하려고 시도하고 손상되어 업데이트가 중단되기 때문입니다. 이 문제를 해결하려면 참고 섹션을 참조하십시오. 이 절차는 올바른 순서로 수정하는 것이며 컨트롤 스테이션에서 명령 프롬프트를 통해 수행해야 합니다.
1) nasadmin
으로 Control Station에 로그인합니다. 2) 다음 예에 따라 복제 세션 이름을 식별합니다.
2) 다음 예에 따라 복제 체크포인트를 식별하고 삭제합니다.
3) 다음 구문을 사용하여 복제 세션을 삭제합니다.
4) 위의 3단계만 사용하여 원격 측에서도 복제를 삭제합니다.
위의 단계 중 하나라도 실패하면 Dell EMC 기술 지원 부서에 문의하십시오. 이 기술 자료 문서 ID를 인용하십시오.
영향을 받는 복제를 삭제하려면 다음과 같이 합니다.
세션 삭제를 직접 시도하는 경우 삭제 작업이 중단된 것으로 나타날 수 있습니다. 삭제는 루트 체크포인트를 업데이트하려고 시도하고 손상되어 업데이트가 중단되기 때문입니다. 이 문제를 해결하려면 참고 섹션을 참조하십시오. 이 절차는 올바른 순서로 수정하는 것이며 컨트롤 스테이션에서 명령 프롬프트를 통해 수행해야 합니다.
1) nasadmin
으로 Control Station에 로그인합니다. 2) 다음 예에 따라 복제 세션 이름을 식별합니다.
a) Find the full name of root checkpoints by: [nasadmin@CS0 ~]$ server_mount ALL | grep unmount root_rep_ckpt_28_242474_1 on /root_rep_ckpt_28_242474_1 ckpt,perm,ro,<unmounted> root_rep_ckpt_28_242474_2 on /root_rep_ckpt_28_242474_2 ckpt,perm,ro,<unmounted> b) For each checkpoint, issue the following command and note the file system name [nasadmin@CS0 ~]$ /nas/sbin/rootnas_fs -info root_rep_ckpt_28_242474_1 | grep checkpt_of checkpt_of= fs1 Mon Jun 15 16:51:54 EDT 2015 Repeat above as every FS will have 2 root checkpoints per replication session, so good to get all FS names first before proceeding to next step
2) 다음 예에 따라 복제 체크포인트를 식별하고 삭제합니다.
a) Identify the file system name from the replications failing with critical errors by :
nas_replicate -list
Example:
$ nas_replicate -i jsq-stx-mq
ID = 156_APM001_01F4_137_APM002_01F4
Name = rep_fs1
Source Status = Critical 8865448248: The replication session encountered an error that halted progres s.
Network Status = OK
Destination Status = OK
Last Sync Time = Wed Jul 13 14:35:15 EDT 2016
Type = filesystem
Celerra Network Server = CS01
Dart Interconnect = Replication
Peer Dart Interconnect = Replication
Replication Role = source <== note the role
Source Filesystem = fs1 <== this is the fs name if the role is source
Source Data Mover = server_2
Source Interface = 10.x.x.x
Source Control Port = 0
Source Current Data Port = 0
Destination Filesystem = fs1-DR <== this is the fs name if the role is destination
Destination Data Mover = server_2
Destination Interface = 10.x.x.x
...
Match this name from names identified in step 2 to ensure they are same.
b) Check the replication checkpoint status by : fs_ckpt <fs_name> -list -all
Example:
$ fs_ckpt fs1 -list -all
id ckpt_name creation_time inuse fullmark total_savvol_used ckpt_usage_on_savvol
32 root_rep_ckpt_28_242474_ 06/15/2015-16:51:54-EDT y 90% INACTIVE N/A
33 root_rep_ckpt_28_242474_ 06/15/2015-16:51:56-EDT y 90% INACTIVE N/A
34 fs1_ckpt1 06/17/2015-16:51:56-EDT y 90% INACTIVE N/A
Info 26306752329: The value of ckpt_usage_on_savvol for read-only checkpoints may not be consistent with the total_savvol_used.
id wckpt_name inuse fullmark total_savvol_used base ckpt_usage_on_savvol
INACTIVE indicates, this is corrupted.
c) If the "inuse" value is "y", delete the root checkpoints using the following command: /nas/sbin/rootnas_fs -delete id=<root_ckpt_id> -o umount=yes -ALLOW_REP_INT_CKPT_OP
Rarely, root checkpoint may have, inuse" value as "n", then, /nas/sbin/rootnas_fs -delete id=<root_ckpt_id> -ALLOW_REP_INT_CKPT_OP
Example:
[nasadmin@CS0 ~]$ /nas/sbin/rootnas_fs -delete id=32 -o umount=yes -ALLOW_REP_INT_CKPT_OP
id = 32
name = root_rep_ckpt_28_242474_1
acl = 0
in_use = True
type = ckpt
worm = off
..
d) Repeat above step and delete all the root checkpoints
e) For non root checkpoints, delete using same command with out the last arument (Example: /nas/sbin/rootnas_fs -delete id=34 -o umount=yes)
For the "source" replication role : nas_replicate -delete <replication_session_name> -mode source -background For the "destination" replication role : nas_replicate -delete <replication_session_name> -mode destination -background Above command will give a task number, which can be used to view the status, by "nas_task -i <task_number>
4) 위의 3단계만 사용하여 원격 측에서도 복제를 삭제합니다.
[ "nas_replicate -delete <session_name> -mode <mode> -background" ]위의 모든 단계가 완료되면 복제 삭제 작업이 완료됩니다. Unisphere 또는 명령 프롬프트를 사용하여 새 복제를 재구성할 수 있습니다.
위의 단계 중 하나라도 실패하면 Dell EMC 기술 지원 부서에 문의하십시오. 이 기술 자료 문서 ID를 인용하십시오.
Additional Information
Unisphere에서 또는 "nas_replicate -delete" 명령을 통해 세션을 직접 삭제하려고 하면 삭제 작업이 중단된 것으로 나타날 수 있습니다. 대부분의 경우 Data Mover를 재부팅하지 않고도 이 문제를 해결할 수 있습니다.
1) 다음을 통해 작업 식별 :
2) 다음을 통해 자세한 정보(특히 Data Mover 이름)를 찾습니다.
3) 다음과 같이 작업을 중단합니다.
위에서는 복제 세션과 루트 체크포인트도 삭제해야 합니다. 모든 사용자 체크포인트는 수동으로 삭제해야 합니다.
1) 다음을 통해 작업 식별 :
nas_task -list | grep -i run
2) 다음을 통해 자세한 정보(특히 Data Mover 이름)를 찾습니다.
nas_task -info <task_number>
3) 다음과 같이 작업을 중단합니다.
nas_task -abort <task_numer> -mover <data_mover_name>
위에서는 복제 세션과 루트 체크포인트도 삭제해야 합니다. 모든 사용자 체크포인트는 수동으로 삭제해야 합니다.
Affected Products
vVNXArticle Properties
Article Number: 000056557
Article Type: Solution
Last Modified: 29 Jul 2025
Version: 4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.