开始新对话

未解决

此帖子已超过 5 年

12905

2016年12月7日 23:00

【专家问答】神奇备份在哪里--RecoverPoint篇

好消息,新一期的“专家问答”活动已经开启啦!


本期专家问答将讨论的主要内容有:

  • RecoverPoint 的基础架构指南
  • RecoverPoint for VMs的基础架构指南
  • 常见CLI 命令简介
  • 拷贝测试、生产数据恢复和故障切换的Recoverpoint实践
  • 如何收集Recoverpoint日志和性能数据
  • RPO/RTO,Protection Window在RP中的具体描述
  • RecoverPoint日志卷使用分布解析
  • RPA风扇损坏及宕机等硬件故障
  • RPA时钟同步问题
  • 无法登录图形化管理界面 + 与VPLEX相关的常见报错


坐镇专家们均为多年从事RecoverPoint技术问题解决的高级技术工程师们,将全面和大家一起讨论和分享上述话题。不论您有任何关于此题目相关问题,或是想更多的了解其方方面面,请抓住这个与专家直接对话的机会,以回帖的方式来参与在线提问吧。

以往所有已完成的“专家问答”活动可参考这个汇总贴

本期讨论主题:神奇备份在哪里--RecoverPoint篇

本期持续时间:2016年12月12日–12月23日,为期两周。

我们邀请到的专家有:


谢紫玲.jpg


Apple Xie 谢紫玲

Apple Xie 于2014年加入EMC RecoverPoint 技术支持团队,熟悉远程数据备份复制体系架构,擅长RecoverPoint硬件以及软件性能问题。熟悉VMware与RP的部署流程,以及对RP4VM的问题排查有着丰富的技术经验。










骆嘉.jpg


Jia Luo 骆嘉

Jia于2014年加入EMC RecoverPoint技术支持团队,主要负责RecoverPoint硬件、软件方面的支持工作。对于典型的ReoverPoint相关排错技巧有非常丰富的经验。精通基本产品架构,且熟练掌握RecoverPoint for VMs相关排错知识。











王怡.png


Susan Wang 王怡

Susan Wang于2014年加入EMC Recoverpoint 技术支持团队,精通Recoverpoint体系架构。主要负责Recoverpoint硬件、操作流程、网络连通和性能方面的支持工作,并且熟悉Recoverpoint与各种存储的集成和错误排查。





和专家交流,与同行畅谈。欢迎大家以回帖的方式就本次主题相关问题,来积极提问和踊跃发表自己的意见。期待您的参与!


本帖将于活动当日正式开启!

8 消息

2016年12月14日 17:00

异地同步模式下。主机的io不是得收到容灾端返回的确认才能进行下一个Io么?如果中间网络断了。那得不到容灾端的确认反馈,前端主机还能继续进行下一个IO?

13 消息

2016年12月14日 18:00

大家好,今天由我为大家介绍拷贝测试、生产数据恢复和故障切换的Recoverpoint实践


(以下截图基于4.4.x版本、非XtremIO环境)

测试拷贝:

Recoverpoint的其中一项关键功能就是能够测试生产数据的时间点快照(Point-in-time Snapshot)。正常复制时,主机会向一致性组(Consistency Group)的生产卷写入数据。所写入的这些数据会编译成一份快照存储在拷贝的日志卷(Journal)中。一份快照可以包含一项或多项写入数据,具体取决于一致性组设置的策略。

如果要验证拷贝是否可靠一致,可以通过选择时间点快照,然后使用灾备站点的主机进行访问。具体请见以下步骤:

1. 登录图形化管理界面,选择Recovery-->Test a copy

2. 在Select a copy界面,选择一个一致性组。然后选择一个非生产的拷贝。

3. 点击按钮” Next Select an Image”

4. 选择一个你想测试的时间点快照,或选择最新的快照。同时,选择测试的模式(Image access mode)。

模式:

Logged accessphysical):适用于测试时需要读写较多的数据。

Virtual access:适用于测试时只需要读写少量数据。

5. 点击按钮“Next Test the image ”

6. 测试之前, 请等待“Enable access to the image to test”完成。这段时间内,数据会回滚到选择的时间点。如下图所示,“Enable access to the image to test”完成后, 左边会出现绿色的勾。

forum.PNG.png

7. “Enable access to the image to test”完成后,将拷贝卷挂载到灾备站点的主机上。

测试时, 请监控“Image access log capacity”“Journal Capacity” 界面会显示它们的使用情况(如上图所示)。

“Image access log capacity”:默认的情况下,这部分占用日志卷的20%,它会记录测试时写入的数据。当它100%时,测试会被终止。因此,如果您想测试更长的时间, 请在它达到100%之前,选择增加日志卷、撤销写(Undo Writes)、转变成Direct accessEnable Direct Access)。

“Journal Capacity”:请避免其达到100% 不然复制会出现“Error”。如果您想测试更长的时间,请在其100%之前,选择增加日志卷。

注意,在选择撤销写之前,请关闭所有使用拷贝卷的应用,卸载拷贝卷。写撤销之后,重新将要拷贝卷挂载到灾备站点的主机上继续测试。

另外,当选择转变成Direct access之后,将不可以回滚到之前的快照。如果测试时生产站点发生数据损坏,在测试时写入的新数据也不可以被删除除非有其他的拷贝。

8.点击按钮“cancel“将会终止测试。点击按钮”save&close”会退出当前界面,但是测试不会被终止。可以前往“Manage Recovery”继续监控测试情况。

9. 测试终止之前, 请关闭测试时的应用,并且卸载测试卷。

10. 终止测试。

Logged accessphysical)和Virtual access:测试终止之后,所有测试中新写入的数据会被丢弃。

Direct access:测试终止之后,日志卷会被清空,生产站点的数据会与灾备站点的数据进行全同步(full sweep)。

恢复生产数据:

借助Recoverpoint 可以在发生文件或逻辑损坏后恢复生产数据。生产数据可以回滚到以前的时间点。具体请见以下步骤:


1.登录图形化管理界面,选择Recovery-->Test a Copy and Recover Production。

2. Select a copy界面,选择一个一致性组。请选择一个非生产的拷贝。

3.点击按钮“Next Select an Image ”。

4. 选择一个你想测试的快照,或选择最新的快照。同时,选择测试的模式。

5.点击按钮“Next Start Recovery ”。

6. 进入“Start Recovery”界面。

1.PNG.png

7.测试之前, 请等待“Enable access to the image to test”完成。

8.“Enable access to the image to test”完成后,将拷贝卷挂载到灾备站点的主机上。

测试时,请监控“Image access log capacity”的状态和“Journal Capacity”的状态。

注意,在选择撤销写之前,请关闭所有使用拷贝卷的应用,卸载拷贝卷。写撤销之后,重新将要拷贝卷挂载到灾备站点的主机上继续测试。

9.点击按钮“cancel“将会终止测试。点击按钮”save&close”会退出当前界面,但是测试不会被终止可以前往“Manage Recovery”界面继续监控情况。

10.点击按钮“Finish” 将会终止测试并且开始恢复生产。在这之前, 请先在灾备站点的主机上卸载拷贝卷。

“Manage Recovery”界面,可以看到复制方向发生改变,变成从灾备到生产,这表明正在恢复生产站点的数据。恢复完成后,生产站点的日志卷中的数据会被清空。复制方向恢复到原来的从生产到灾备。


故障切换:


通过将一致性组故障切换到某个本地拷贝或某个远程拷贝,可使系统凭借该拷贝照常继续操作。快照现在将从(原先的)拷贝传输到(原先的)生产日志,再从生产日志传输到生产存储。生产存储恢复完毕或计划内维护完成后, 可以通过再次执行故障切换在原始生产站点恢复系统操作。

具体请见以下步骤:


如果一致性组中只有一份拷贝,在开始以下步骤之前, 请安全地关闭生产站点Windows主机活动,并且确保文件系统已经推送到生产卷,文件系统的最新快照已经生成。一些应用,比如Exchange,有自己的缓存,也需要进行推送。在生产站点,关闭所有使用一致性组中卷的应用。并将一致性组的卷设置为offline


1.登录图形化管理界面,选择Recovery-->Test a Copy and Fail Over。

2. Select a copy界面,选择一个一致性组。请选择一个非生产的拷贝。

3.点击按钮“Next Select an Image”。

4. 选择一个你想测试的快照,或选择最新的快照。同时,选择测试的模式。

5.点击按钮“Next Start Failover ”

6.进入“Start Failover”界面

2.PNG.png

7.测试之前, 请等待“Enable access to the image to test”完成。

“Enable access to the image to test”完成后,将要拷贝卷挂载到灾备站点的主机上。

测试时,请监控“Image access log capacity”的状态和“Journal Capacity”的状态。

注意,在选择撤销写之前,请关闭所有使用拷贝卷的应用,卸载拷贝卷。写撤销之后,重新将要拷贝卷挂载到灾备站点的主机上继续测试。

8. 点击按钮“cancel“将会终止测试。点击按钮”save&close”会退出当前界面,但是测试不会被终止。

9. 当测试完成后,如果一致性组中只有一份拷贝,请从灾备站点的主机上卸载拷贝卷。

10. 点击按钮“Finish” 故障切换开始。

如果一致性组中只有一个拷贝,生产的日志卷和拷贝的日志卷会被清空, 一致性组会进行全同步(full sweep, 然后复制会开始。此时,可以看到复制方向是从灾备站点到生产站点。

如果一致性组中的拷贝多于一个, 会跳转到“Manage Recovery”界面。您可以修复生产站点的问题,同时您可以在拷贝站点上运行应用程序。结束之后,您可以选择切换回去或者将拷贝设置为新的生产。

管理测试、恢复生产和故障切换:

我们可以使用“Manage Recovery”界面监管测试、恢复生产和故障切换。


测试拷贝:

我们可以看到如下界面。在这里我们可以监控“Image access log capacity”的状态和“Journal Capacity”的状态。Next Action中有两个选项:Continue TestingFinsh Testing

3.PNG.png

如果选择Continue Testing 会切换到以下界面:

4.PNG.png

如果选择Finish Testing 则测试会被终止。


生产恢复:

在测试阶段点击按钮“Save&Close”,可以进入以下界面。但是, 在这里只有“Back to Wizard”的选项。

5.PNG.png

点击“Back to Wizard”,回到之前的界面。

6.PNG.png

故障切换:

当一致性组中有超过一份拷贝,我们认为是暂时性切换。比如, 我们有一个一致性组Edgar 它有两个拷贝,一个在生产站点(local) 一个在灾备站点(DR)。现在我们进行从生产站点(Prod)到灾备站点(DR)的切换。

7.PNG.png

故障切换后,复制方向发生改变,现在是从DRProd。此时,Next Action中有两个选项:切换回原来的生产(Fail back to Production)和设置拷贝为新的生产(Set Copy as Production)。

8.PNG.png

切换回原来的生产(Fail back to Production:

1. 当生产站点故障修复后,可以选择“Fail Back to Production“

2. 转入” Select an Image“界面。您可以选择一个您想要切换回去的快照。

3. 点击按钮”Finish“之后,生产站点的日志卷会被清空。从Prodlocal的复制会自动恢复。从ProdDR的复制也会开始。


设置拷贝为新的生产(Set Copy as Production):

1. 在原来的生产站点主机上,关闭使用拷贝卷的应用,卸载拷贝卷。

2. 选择设置拷贝为新的生产(Set Copy as Production)。

3. 因为还有一个local所以会有“Set Production”界面跳出,询问如何处理local拷贝:

如果您想继续使用local 可以选择配置一个新连接。“Disable Copy“会保留local中的数据和配置。”Remove Copy“会删除local中的数据和配置。

9.PNG.png

4. 新的生产站点的日志卷会被清空。

明天将会分享如何收集Recoverpoint日志和性能数据”。敬请期待。

13 消息

2016年12月14日 19:00

RP有三种复制模式:异步,同步,和动态。

1. 我之前的回复指的是异步模式。异步模式下,只要生产的RPA收到IO,主机就可以继续下一个IO,因此不受网络断开影响,这是默认的模式。

2. 您说的“主机的IO收到容灾端返回的确认才能进行下一个IO”指的是同步模式,同步模式下,如果网络不是特别好, 主机会受到影响。但如果网络断了,主机的IO会mark在生产的日志卷中。

3. 动态模式指正常情况下使用同步模式。客户会设置一个阀值,当环境中出现异常达到阀值,会自动转换为异步模式。

13 消息

2016年12月15日 17:00

今天将为大家介绍如何收集Recoverpoint日志和性能数据”,以便我们更好地定位并快速解决问题

Recoverpoint 4.1.x 4.4.x图形化界面日志收集:


1. 使用admin账户登录图形化管理界面, 选择Admin-->System Analysis Tools-->Collect System Information。点击“Start”按钮。

1.PNG.png

2. 选择日志需要覆盖的时间、RPA站点和拆分器。一般情况下,我们不需要勾选“core files”。

2.PNG.png

3. 点击下方的“Next Test Connectivity”按钮。

4. 连接性测试完成后, 会将结果反馈在以下界面中,请确保RPA和拆分器的连接状态都是正常,之后请点击右下方的“finish”按钮。

3.PNG.png

5. 收集的过程中,会有进度条显示完成的比例。

6. 收集完成后,按钮“Display Results“会变亮,点击。

4.PNG.png

7. 可以看到下载日志的地址。

5.PNG.png

8. 使用浏览器打开地址,并使用admin账户登录。日志文件是一个TAR文件,以“sysInfo“开头。

6.PNG.png

Recoverpoint 4.1.x 4.4.x使用SSH收集日志:


1. 使用工具(比如Putty)登录站点管理地址(cluster management IP)。登录时使用boxmgmt账户。

2. 选择[3] Diagnostics-->[4] Collect system information。

3.  根据提示,输入日志需要覆盖的时间、选择将所有文件打包成TAR、不收集core files、选择是否收集拆分器日志、选择要收集日志的站点。

7.PNG.png

4. 选择完成后,会进入测试连接性阶段。请确保所有的连接都是“Action succeeded”。之后,日志收集开始。

8.PNG.png

5. 日志收集完成后,会提示去哪里下载日志。

9.PNG.png

6. 使用浏览器打开地址,并使用admin账户登录。日志文件是一个TAR文件,以“sysInfo“开头。



RP4VM 4.3.x 日志图形化界面日志收集:


1. 登录VMWare vSphere Web Client。点击Recoverpoint for VMs的图标。

2. 依次点击Administration-->vRPA Clusters -->Log Collection。

0.PNG.png

3. 选择日志需要覆盖的时间。显示时间可以在当地时间和GMT时间切换。

4. 选择需要的站点。

5. 点击按钮“start“。开始测试连接性。

6.测试完成后,开始收集日志。收集过程中,会有进度条显示。

11.PNG.png

7. 收集完成后,会提示去哪里下载日志。

22.PNG.png

8. 使用浏览器打开地址,并使用admin账户登录。日志文件是一个TAR文件,以“sysInfo“开头。



RP4VM 4.3.x使用SSH收集日志:


1. 使用工具(比如Putty)登录群集管理地址(cluster management IP)。登录时使用boxmgmt账户。

2. 选择[3] Diagnostics-->[4] Collect system information。

3. 根据提示,输入日志需要覆盖的时间、选择将所有文件打包成TAR、不收集core files、选择要收集日志的站点。

33.PNG.png

4.选择完成后,会进入测试连接性阶段。请确保所有的连接都是“Action succeeded”。之后,日志收集开始。

44.PNG.png

5. 日志收集完成后,会提示去哪里下载日志。

55.PNG.png

6. 使用浏览器打开地址,并使用admin账户登录。日志文件是一个TAR文件,以“sysInfo“开头。



RP4VM 4.3.x 日志图形化界面拆分器日志收集:


1. 登录VMWare vSphere Web Client。选择一台ESXi主机,然后右击选择All vCenter Actions --> Export System Logs....。

2. 在以下显示的界面中,选择需要的日志。

66.PNG.png

3. 点击按钮“Generate Log Bundle”。

4. 点击按钮“Download Log Bundle”。



long_term_stats(性能数据)收集方法:

1. 使用工具(比如Putty)登录群集管理地址(cluster management IP)。登录时使用admin账户。

2. 输入命令export_consolidated_statistics。

3. 默认颗粒度的选择(直接按回车)。

77.PNG.png

4. 输入需要覆盖的时间。

88.PNG.png

5. 等待数十分钟后,显示获取long_term_stats的地址。

99.PNG.png

6. 使用浏览器打开地址,并使用admin账户登录。文件是一个gz文件。

00.PNG.png

下周我们将继续分享其他的内容。敬请期待!

2 Intern

 • 

2.1K 消息

2016年12月16日 01:00

非常详细的分享

5 Practitioner

 • 

274.2K 消息

2016年12月17日 15:00

大家好, 今天由我给各位介绍一下RPO,RTO, Protection Window在RP数据保护中的具体应用。

很多朋友可能之前有了解过,在灾难恢复方面,主要的衡量指标有两个:一个是 RTO,另一个是 RPO

所谓 RTORecovery Time Objective,它是指灾难发生后,从 IT 系统当机导致业务停顿之时开始,到 IT 系统恢复至可以支持各部门运作、恢复运营之时,此两点之间的时间段称为 RTO

所谓 RPORecovery Point Objective,是指从系统和应用数据而言,要实现能够恢复至可以支持各部门业务运作,系统及生产数据应恢复到怎样的更新程度。这种更新程度可以是上一周的备份数据,也可以是上一次交易的实时数据。


1.在RP系统里,RTO指的是Maximum journal lag。这个参数是可以在日志卷里进行客户自定义的,一般默值是unlimited。当容灾站点的RPA接收数据的速度快于数据分发到存储的速度时,新数据就会先存在容灾端的日志卷里,然后再从日志卷分发写到存储的复制卷,而Maximum journal lag就是指日志卷中能存储的最大快照数量。换句话来说,RTO就是指某个所要求的某个恢复时间点之前的快照全部从日志卷分发到容灾段复制卷的时间,只有写到复制卷之后,生产和容灾段的数据才能算完全同步。所以,所谓journal lag就是指容灾端写到了日志卷但是还没有分发到复制卷的数据差。


2.关于RPO,在RP系统就是指两个站点之间的lag,表示数据写到了生产卷但是还未传到容灾站点的数据,所以对于同步复制来说,RPO基本为0,一般设置RPO都是与异步复制相关的。


3.Protection window决定了该一致性组能够回滚的时间范围,也就是说所存的快照最远能回滚到哪个时间点。在RP的管理界面,包括有三个关于保护窗口的参数,Required  Protection  WindowCurrent Protection  WindowPredicted Protection Window

1. Required Protection Window是用户自定义的,用户可以根据应用要求或者数据的重要性来设置不同的值。

2. Current Protection Window 是系统计算的实时的保护窗口,如果客户自定义了Required Protection Window的话,该参数下会显示有以下几种状态:

1>       Sufficient:表示现时段可回滚的快照能达到客户要求数据回滚时间。

2>       Insufficient:表示现时段可回滚的快照不能达到客户要求数据回滚时间。

3>       Extending:表示复制还没进行到所要求的保护窗口的时间点。

如果用户没有设置Required Protection Window,则该参数会显示成N/A的状态。

3. Predicted Protection Window是系统对保护窗口大小的预测。由于系统状态随时可能变化,不能保证具体需要多长时间能达到预测的保护窗口值,该参数也有两种状态,Sufficient Insufficient,表示预测的保护窗口是否能够满足用户自定义的回滚时间要求。

如果用户开启了快照压缩的话,该参数会显示成N/A

pic1.png

pic2.png

5 Practitioner

 • 

274.2K 消息

2016年12月18日 15:00

了解RP的朋友应该知道日志卷是数据备份和容灾的重要部分,容灾站点的日志卷主要是用来存储快照。之前一直有客户问为什么了分配了好几T的空间给RP作为日志卷,为什么实际使用的时候就没那么多了呢?那么那些“失踪的日志卷空间”到底去哪里了呢?

今天我就给大家详细介绍一下RP的日志卷是如何分配的

系统默认情况下,日志卷的20%是专用作image access log。主要是当快照被拉起时(logged access)用于存储容灾端主机写进来的测试数据,大家知道很多时候测试时的数据是不需要最终写到复制卷的,所以在image access的时候由容灾端主机发出的写是先存在日志卷里的image access log,至于最后要不要把这些数据写到复制卷是客户自己决定的,这个具体就参考susan写的实践操作部分了这个20%的值是可以调节的,也就是说如果用户认为他测试时数据量很大,担心20%不够存储测试时的写入量,用户可以自行调节这个比例,其影响是一旦更改,一致性组需要重新同步一次。

日志卷的另外5%是用于virtual access(与logged access相对)时索引值的计算,另外还预留有约1GB用于处理日志卷分发过程中出现的突发状况。

最后,余留的75%左右的日志卷空间才是真正用来存储快照。如果用户开启了快照压缩,压缩的进程会占去这75%25%。因此,一旦压缩开启了的话,日志卷必须至少有75%25%是空余的,不然压缩无法进行系统也会出现相应的报错。

好了,我就说到这了,如有疑问欢迎提问~

2 消息

2016年12月20日 07:00

您说的“如果网络断开时间过长,日志卷满了,在网络恢复之后,会在生产和灾备进行全同步以保证数据一致性”。

我想问一下,既然是CRR异步复制,中间的WAN网络断开的时间内,生产业务变化的数据是存在哪个日志卷上呢?网络断了,到复制端的日志卷肯定是不通的。而且我觉得变化数据也没有存放在生产端的日志卷上。您能确认一下吗?

5 Practitioner

 • 

274.2K 消息

2016年12月20日 15:00

你好,当WAN连接断开的时候,生产的RPA不能将数据传到对端RPA,所以这时候系统会将所有数据的变化量记录在生产的RPA1,RPA2上,同时在生产的日志卷里也会有记录,这就是我们平时说的marking on host的状态。直到wan连接恢复,复制能继续进行,系统会把所有这断开连接过程的数据变化量重新传到对端站点的RPA。

一般情况下,以下情况会让RPA进入marking mode:

1.wan连接断开

2.对端站点的RPA不能工作了(比如宕机)

3.传输被手动暂停了

4.high load,复制环境中出现瓶颈的时候

5 Practitioner

 • 

274.2K 消息

2016年12月20日 17:00

今天我们来聊一下怎么处理RPA风扇损坏,前面板显示异常以及机器宕机的问题。

现象:1. RP命令行或者图形管理界面发现告警“RPA fan failure detected

      2.RPA实体机器的LED面板显示有“E171F PCIE fatal error Bus x Device x Function x

      3. RPA显示宕机并且IP无法ping通。

解决方法:

对于此类硬件问题包括风扇以及LED面板的报错,因为有涉及到部分机器会发生假报错的可能性,建议先掉电重启有问题的RPA看是否能清除报错,方法如下:

  1. 1.       boxmgmt的账户登到命令行(默认密码:boxmgmt)选择[5] Shutdown / Reboot operations ->[2] Shutdown RP 或者在机房将RPA关机(RPA已经完全宕机的情况下,此步骤可省略)
  2. 2.       把电源线从有问题的RPA的电源供应器拔出
  3. 3.       等待十秒钟左右再重新插入电源线并重启这台RPA
  4. 4.       观察RPA是否正常启动

如果告警消除,则表明是假报错,可以忽略;如果掉电重启无法解决问题,请联系Dell/EMC售后支持进行备件更换。

5 Practitioner

 • 

274.2K 消息

2016年12月21日 22:00

NTP时钟同步问题

现象: 图形管理界面看到告警信息“RPA clock is out of sync

问题分析:NTP是用来同步安装环境中所有的设备的时钟的,最佳实践是配置一台基于LinuxNTP服务器(鉴于Windows服务器与RP的同步问题较多,不建议使用windows)。最好是一个站点配置一个外部NTP服务器,配好之后RPA1会先和外部的服务器同步,然后其他的RPARPA1同步,所以RPA之间的连通性也会很大程度上影响时间同步问题。

问题解决:

1.首先需要确认RP系统是否配置了外部的NTP服务器,方法如下:

boxmgmt的账户并使用站点管理IP然后SSHRPA上,选择[2] Setup—> [6] View  settings-à选择有问题的站点并查看所有的IP配置,确认NTP server配置了正确的IP地址。

1..png

如果没有配置,请登录https://support.emc.com下载最新的Deployment Manager工具并联系售后技术支持配置正确的NTP服务器或者在用boxmgmt的账户登录站点管理IP选择[2] Setup—>[1] Modify settings->[1] Enter cluster xxx details -->[1] General cluster details.

2.png

1. 如果NTP服务器已经配置正确,接下来就需要测试RPANTP服务器的通信状况,包括连接性以及TCP,UDP 123端口是否打开。

boxmgmt的账户SSHRPA,选择[3] Diagnostics—>[1] IP diagnostics ->[1] Cluster connectivity tests->[4] NTP server.

3.png

2.如果连通性状态都是正常的,可以测试RPANTP服务器之间的同步状况。

  boxmgmt的账户SSHRPA,选择[2] Setup ->[3] Synchronization diagnostics可得到一下输出:

4.png

第一列IP前带*号,St值小于16则表示同步成功;

3.如果上一步第一次同步不成功,可以尝试一下方法强制RPA与服务器同步一次:

boxmgmt的账户SSHRPA,选择[2] Setup—> [8] Advanced options-> [7] Set time via NTP->输入ntp服务器的IP 地址,由于RPA2-8都是和RPA1同步,所以对其他RPA来说,RPA1就是他们的时钟同步服务器,需输入RPA1IP地址。


5.png

一般情况下,系统需要1020分钟完成所有RPA的同步,强制同步一次之后可稍等一会看是否能同步成功。

4.st值大于16或者没有星号但是RPA与服务器连通性都是正常的话,需要检查NTP服务器配置那端是否把RPA都加到了白名单具体细节请联系您的NTP服务器管理员。

  如果RPA1能和NTP服务器同步成功,但是其他RPA无法和RPA1同步成功,RPA1和其他RPA的通信正常的话,请联系售后技术支持。


13 消息

2016年12月22日 17:00

今天为大家介绍两个比较常见的错误的解决方法。

无法登录图形化管理界面:


有时候,我们会发现图形化管理界面无法打开,遇到这种情况,请尝试以下三种方法:

1.将浏览器的缓存清一下。

2.换一个浏览器。

3.重启site control RPA:

     a.使用工具(比如Putty)登录站点管理地址(cluster management IP)。登录时使用boxmgmt账户。

     b.选择菜单[5] Shutdown / Reboot operations-->[1] Reboot RPA。

     c.等待RPA启动完成, 重新尝试登录图形化界面。

4.如果以上方法还是无法解决问题,欢迎拨打我们的热线。


VPLEX相关的常见报错:


RPVPLEX相连时,会有客户发现以下报错:

WARNING: Failed to retrieve VPLEX management view. Cause: Failed to get virtual-volumes from [vplex, clusters, *] ;

出现这个报警的原因可能是证书过期了。

在这种情况下,请尝试以下步骤:


1.登录Recoverpoint的图形化管理界面。

2.选择RPA Clusters-->报错中的站点-->Storage, 选中报错中的VPLEX。

111.PNG.png

3.点击按钮Edit。

4.在以下对话框中重新输入service的密码,然后点击按钮OK。

222.PNG.png

5.等待12分钟,看报错是否消失。

6.如果没有,点击按钮Remove 将注册的VPLEX删除。

333.PNG.png

7.点击按钮Add。重新把VPLEX加入RP。

8.报错应该会在12分钟后消失。

9.如果还是有问题,欢迎拨打我们热线, 我们会及时为您查看并解决。



13 消息

2016年12月22日 20:00

您好,

1. journal的大小取决于很多因素,比如,生产的数据变化量和速度, 需要的protection window的大小,image access log的占比,snapshot consolidation的配置等等。

如果日后您想增加journal的大小,也是可以的。

2. failover之前会要求先测试image,测试完成后点击failover。点击完成后,角色互换几乎是马上发生的。

13 消息

2016年12月22日 20:00

您好,

你可以用security-admin登录后查看这个账户是否被锁住。查看的命令:unlock_user。

Community Manager

 • 

7.1K 消息

2016年12月22日 20:00

各位专家好!

微信用户“杨景茂”提问:

为什么我用security-admin 用户把我的一个普通新创建的admin类型用户密码重置后,还是登录提示密码不对?

找不到事件!

Top