开始新对话

未解决

此帖子已超过 5 年

12749

2016年12月7日 23:00

【专家问答】神奇备份在哪里--RecoverPoint篇

好消息,新一期的“专家问答”活动已经开启啦!


本期专家问答将讨论的主要内容有:

  • RecoverPoint 的基础架构指南
  • RecoverPoint for VMs的基础架构指南
  • 常见CLI 命令简介
  • 拷贝测试、生产数据恢复和故障切换的Recoverpoint实践
  • 如何收集Recoverpoint日志和性能数据
  • RPO/RTO,Protection Window在RP中的具体描述
  • RecoverPoint日志卷使用分布解析
  • RPA风扇损坏及宕机等硬件故障
  • RPA时钟同步问题
  • 无法登录图形化管理界面 + 与VPLEX相关的常见报错


坐镇专家们均为多年从事RecoverPoint技术问题解决的高级技术工程师们,将全面和大家一起讨论和分享上述话题。不论您有任何关于此题目相关问题,或是想更多的了解其方方面面,请抓住这个与专家直接对话的机会,以回帖的方式来参与在线提问吧。

以往所有已完成的“专家问答”活动可参考这个汇总贴

本期讨论主题:神奇备份在哪里--RecoverPoint篇

本期持续时间:2016年12月12日–12月23日,为期两周。

我们邀请到的专家有:


谢紫玲.jpg


Apple Xie 谢紫玲

Apple Xie 于2014年加入EMC RecoverPoint 技术支持团队,熟悉远程数据备份复制体系架构,擅长RecoverPoint硬件以及软件性能问题。熟悉VMware与RP的部署流程,以及对RP4VM的问题排查有着丰富的技术经验。










骆嘉.jpg


Jia Luo 骆嘉

Jia于2014年加入EMC RecoverPoint技术支持团队,主要负责RecoverPoint硬件、软件方面的支持工作。对于典型的ReoverPoint相关排错技巧有非常丰富的经验。精通基本产品架构,且熟练掌握RecoverPoint for VMs相关排错知识。











王怡.png


Susan Wang 王怡

Susan Wang于2014年加入EMC Recoverpoint 技术支持团队,精通Recoverpoint体系架构。主要负责Recoverpoint硬件、操作流程、网络连通和性能方面的支持工作,并且熟悉Recoverpoint与各种存储的集成和错误排查。





和专家交流,与同行畅谈。欢迎大家以回帖的方式就本次主题相关问题,来积极提问和踊跃发表自己的意见。期待您的参与!


本帖将于活动当日正式开启!

1.6K 消息

2016年12月11日 19:00

题目很魔幻的感觉

1.2K 消息

2016年12月11日 19:00

本期活动正式开启,大家有与RecoverPoint相关主题的问题的话,欢迎回帖提问

416 消息

2016年12月11日 19:00

我这几天部署两次RPA,一个是两个站点的CRR,一个是单站点的CDP。软件版本都是4.4.SP1.P1_h.154。由于这两个客户现场都没有NTP服务器(通常中国的客户现场都没有NTP服务器),在部署完RPA后,RPA都会提示RPA时间不同步,需要配置NTP或者手动同步时间。RPA可以通过boxmgmt用户配置NTP地址,但是没有找到相关手动配置RPA时间的方法。

请问,是否有方法配置手动同步时间的方法?

我尝试过将一个站点的RPA2的NTP配置成RPA1的地址,但是可能由于RPA并不提供NTP服务,所以RPA无法实现时间同步。

建议如果日后的RPA版本更新可以使RPA自己提供NTP服务。

11 消息

2016年12月11日 20:00

大家好, 今天就由我开始发帖吧,后续还有更新请继续关注。首先从最基本的知识开始:

首先介绍RecoverPoint解决方案及其带来的好处。

RecoverPoint是一种企业级解决方案,旨在保护与SAN连接的异构服务器和存储阵列上的应用程序数据。借助RecoverPoint,可以在执行复制的同时,访问本地或者另一个站点上的时间点快照。此功能还与各种不同应用程序相集成。例如SQLVMware

RecoverPoint的优点在于它能够实现近乎即时的数据恢复,针对写操作创建时间点拷贝,实现业务连续性。远程站点可用于测试开发,其复制功能可实现对生产数据和复制副本的完全访问。

  • 物理RPA

物理RecoverPoint 应用装置(RPA)是RecoverPoint 的数据保护控制器。每个站点上的RPA集组成一个RPA集群,根据RecoverPoint 系统安装过程中的设置,每个集群可以包括28RPA

正常运行时,同一站点的所有RPA始终处于活动状态。因此,如果站点中的一个RPA停止运行,RecoverPoint系统支持将功能立即切换到站点的另一个RPA图一.png

图一

每个RPA 均具有下列接口:

四个用于与本地主机应用程序和存储子系统进行数据交换的光纤通道端口(HBA),可与连接到SAN的存储和主机建立冗余连接。

一个用于将数据传输到其他站点的以太网接口(WAN

一个用于管理RecoverPoint系统的以太网接口(LAN

如上图所示: 双节点站点包含

八个光线通道连接(2个节点×每个节点一个HBA×每个HBA4个端口)

四个以太网连接(每个节点一个管理LAN连接和一个数据WAN连接)

五个IP地址(2个节点×2个以太网连接+1个管理的浮动IP地址)

  • 存储库卷(Repository  volume

图二.png

图二

在连接SAN 的存储上,必须有一个专用共享卷专门供每个RPA使用。该卷存储RPA、站点、和一致性组的相关配置信息。它使得正常工作的RPA可以顺利接管同一个RPA站点内出现故障的RPA的复制活动。

每个RecoverPoint站点都有一个存储库卷,该卷通过SAN 或者ISCSI(对于虚拟RPA而言)呈现给每个RPA

  • 日志卷(journal volume

图三.png

图三

一致性组中的每份数据拷贝都必须包含一个或多个专用于保存数据的时间点历史记录的卷。包含在日志中的信息类型及信息量因日志类型的不同而不同。

有两种类型的日志卷:

  1. 1.       拷贝日志
  2. 2.       生产日志

日志卷存放要复制的数据的快照。每个日志卷在其容量允许范围内存储尽可能多的时间点快照,超过此范围将删除最旧的快照,为最新的快照腾出空间。日志可以在不影响复制的情况下增加空间,以存储更长的历史记录。

  • 一致性组(consistency group

一致性组是用来对一组卷的保护。如果两个数据集彼此互相依赖,它们必须存在于同一个一致性组中。一致性组维护数据集之间的写入顺序,以及用于数据保护的设置。这样的参数包括:压缩、带宽限制和最大延迟。

  • RecoverPoint 拷贝

一致性组中存在以下类型的拷贝:

生产拷贝:包含作为一致性组的复制源的所有卷。

本地拷贝:包含作为特定一致性组的复制目标的本地所有卷。

远程拷贝:包含作为特定一致性组的复制目标的远程站点的所有卷。

拷贝存在以下限制:

对于非RPSE而言,每个一致性组最多可以配置一个生产拷贝和四个非生产拷贝。

在本地复制中,只能有一个生产拷贝和一个本地拷贝。

在远程复制中,如果存在本地拷贝,则最多可以由三个远程拷贝。如果不存在本地拷贝,则最多可以有四个远程拷贝。

  • RecoverPoint复制的工作机制

    RecoverPoint复制有两种,本地复制(CDP)和远程复制(CRR),下面将详细介绍数据流过程。

图四.png

图四

CDP 模式下并不使用WAN传输数据,它直接将数据写入到本地卷中。

  1.       主机应用程序向RecoverPoint保护的LUN发送一个写操作,此写操作被拆分,然后发送到生产卷和RPA,在VNX中,拆分器存储在每个SP中。
  2.        RPA收到该写操作的拷贝后,立即返回确认。直到收到生产LUN 返回的ackRPAack发送回主机,并继续执行正常IO

3.      一旦RPA确认了此写操作,会将数据转移到本地日志卷中。

4.       在数据安全进入日志之后,它将被分发到目标卷。

CDP的不同之处是,CRR通过WAN向远程站点复制,此外,CRR会存在复制副本卷和日志卷。

图五.png

图五

  1. 1. 主机应用程序服务器向RecoverPoint保护的LUN发送一个写操作。此写操作被拆分,然后发送到RPA,此操作和CDP相同。
  2. 2. RPA收到写操作的拷贝时,在非同步复制中,本地RPA将立即返回确认。如果是同步复制,则ack会延迟,直至远程站点收到写操作。在收到生产LUN返回的ack以后,一起收到两个ack之后,将ack返回给主机,并继续执行正常的IO
  3. 3. RPA将写操作和其他内容一起捆绑成包。包中会淘汰冗余的数据块,并与对应的时间戳和书签信息一起存储。然后对包进行压缩。
  4. 4. 随后通过IP网络发送到远程RPA
  5. 5. 收到包后,目标RPA会验证以确保包在传输过程中未损坏。
  6. 6. 然后解压数据并将数据写入到日志卷
  7. 7. 将数据写入日志卷之后,将分发到复制卷,确保写入顺序。

更多详细有关管理RPA界面的描述,请参考我们的4.1或者4.4 administration guide

https://support.emc.com/docu54074_RecoverPoint_4.1_Administrator's_Guide.pdf?language=en_US

https://support.emc.com/docu62057_RecoverPoint_4.4_Administrator's_Guide.pdf?language=en_US

接下去两天的日程安排分别是RecoverPoint for VMs 的相关知识以及常见CLI 命令介绍。谢谢您的关注!

11 消息

2016年12月11日 21:00

Newsharp您好,

我们是有如何手动通过boxmgmt账户同步RPA时间的文档的:https://support.emc.com/docu59522_Troubleshooting_and_Resolving_(Clock_out_of_Sync)_Error_in_RPA.pdf?language=en_US

确实一般中国客户NTP 服务器很多都没有配置,建议客户提前配置好一个Linux 的NTP 服务器,一般会报错:

RPA clock is out of sync, contact EMC customer service for corrective action.

1. 先登录到boxmgmt账户,在手动同步之前首先要把NTP配置信息(IP 地址)导入到系统里面。[2] setup --> [1] modify settings  -->  [1] general cluster details

输入一些站点名字,DNS地址,还有NTP地址。

test-1.PNG.png

apply settings以后就可以看到站点信息里面会包含NTP的IP 地址信息。

2. 之后您可以通过deployment manager或者boxmgmt的方式手动同步: [2] setup -> [8] advanced options -> [7] set time via NTP

输入好NTP地址以后就可以同步了。

您也提到建议以后版本能够是RPA能够自己同步,目前为止这是没办法更改NTP的使用的,当然后续版本有待关注。因为RPA非常依赖于精准的时间戳,不同时间点产生快照。所以必须有服务器控制系统时间,以避免不必要的紊乱。感谢您的问题。

28 消息

2016年12月11日 23:00

请教前辈,RP和一般的备份恢复有啥区别呀

416 消息

2016年12月12日 00:00

我刚刚看了这个文档,实际上还是让我配置NTP服务器。RPA就是没有相关命令配置手动配置时间?

2 消息

2016年12月12日 02:00

我想问一下:现在好多CRR场景,客户都是先在一个机房搭建好CRR,通过WAN口完成数据初始同步,同步完成后会把Cluster2搬到异地去,这样Cluster2就涉及到要更改LAN IP(3个)和WAN IP(2个)的问题,利用DM的Cluster Modification Wizard更改IP,是先更改IP再搬迁到异地,还是搬到异地再更改IP呢?

如果先更改IP,更改后Cluster2与Cluster1的IP不通,能完成更改吗?

如果是搬到异地再更改,搬到异地后,CLuster2先前配置的IP就跟Cluster1不通了,更改后会不会影响CRR?

11 消息

2016年12月12日 15:00

是的,事先还是需要配置NTP 服务器,目前为止没有命令能够不使用NTP服务器直接同步RPA时间的。只能通过get_current_time 查询当前RPA的时间戳。 因为如果按照您说的需要更改RPA源代码架构。当然您可以后续关注发布版本。

11 消息

2016年12月12日 16:00

应该是先用DM更改IP 以后,再搬到异地去。即使更改完以后两个站点不通,但是双方站点新的IP配置信息都已经保存了。

所以暂时不通也没关系,等到搬迁完成以后,一连上网复制就可以继续了。

而如果先搬的话,站点保存的信息是不正确的。

11 消息

2016年12月12日 16:00

正如我之前提到的RecoverPoint的优点,在讨论到复制解决方案的时候,都有几个问题要考虑: 对生产应用程序响应时间的影响,通信链路需要多大,目标系统的恢复点,多长的数据风险事件段。

RP可以实现:

1. 与异构的存储,交换机和主机集成,不需要全部更新,简单融合。

2. 智能使用带宽和数据压缩,是数据中心能在跨任意距离的情况运行。无需高带宽,长距离的WAN连接,通信成本较低。

3. 实现任一时间点的按需本地恢复和远程恢复。近乎实时的数据恢复。

28 消息

2016年12月13日 00:00

有类似使用recoverpoint 成功实现数据恢复的demo么?  公开的PPT或者PDF也成啊。

11 消息

2016年12月13日 16:00

大家好,昨天因为比较忙没来得及发帖,今天补上。今天介绍RecoverPoint for VMs的相关知识。

RecoverPoint for VMs 是在RecoverPoint的复制引擎上构建的,它继承了RecoverPoint的大多数强大功能,包括实现任意恢复点目标RPO,利用日志技术实现任意时间点的回滚,本地和远程复制。

产品体系结构:

p1.png

                                                                                                图一

下面就详细介绍一下每个组件以及组件在系统中起到什么作用。

  • RPA(vRPA):

p2.png

图二

vRPAOVA文件的形式提供,该OVA文件包含多个向导, 可提供最安全和最不容易出错的方法来创建 vRPA以及配置虚拟系统资源和网络要求,从而实现正确的部署。通过部署OVA文件,可使用预定义的临时网络设置创建第一个虚拟机。根据需要,可多次重复相同的过程以创建更多的 vRPA,或多次克隆第一个 vRPA

和其他任何虚拟机一样,vRPA操作通过加载虚拟机管理程序分配给它的动态虚拟资源。保留并调配这些资源是管理员的职责。以上表格可用于满足不同性能需求的三种vRPA配置文件。部署vRPA时,必须提前准备并配置四个虚拟网络(WAN, LAN, ISCSI1, ISCSI2)。

一个RecoverPoint for VMs站点中可包含2-8vRPA。需根据负载和性能需求来确定vRPA数量和vRPA配置文件。该解决方案是动态的,可以增加资源量和vRPA数量。如果多个vRPA共享同一个ESXi主机,则当这台主机出现故障就无法实现冗余。因此在资源短缺,以至于必须在同一个主机上运行多个vRPA的情况下,必须提供足够的可用资源。共享主机上可用的资源总量(CPU内存)必须是每个单独的VRPA所需的资源总和。网络带宽必须足以处理所有vRPAIO.

在双vRPA站点的情况下,建议不要让两个vRPA都在同一个ESXi主机上运行,因为如果给ESXi主机发生故障,所有RP都会停止。要在某个ESXi主机发生故障情况下冗余,vRPA不应该共享同一个主机。

  • 络连接

图三.png

图三

一个RecoverPoint for VMs虚拟RPA需要4个虚拟网络接口,分别是WAN, LAN, ISCSI1ISCSI2

WAN 接口用于RecoverPoint  for VMs系统内的vRPA站点之间的运程复制。

LAN连接用于单个站点内的RPA之间,RPA与插件之间的通信以及常规RecoverPoint站点通信。

ISCSI端口用于ESXi拆分器和vRPA之间的连接。

建议将这个四个连接分离到四个子网中。由于vRPA依赖于虚拟网络,因此管理员向vRPA iSCSI 虚拟交换机呈现的带宽将决定vRPA可实现的性能。

  • ESXi拆分器

p4.png

图四

如果站点中所有ESXi主机都承载了受保护生产虚拟机或复制副本虚拟机,则需要为其安装ESXi拆分器。该拆分器是一个vSphere安装捆绑包文件。拆分器将IO 发送到生产VMDK 文件和RecoverPoint站点。

p5.png

图五

本地复制如图五所示,该拆分器会拆分写入到某个虚拟机的VMDK/RDMIO写操作,并将一份拷贝发送到生产VMDK以及RecoverPoint for VMs的集群中。vRPA会将写IO信息发送到复制副本日志,从而是终端用户能在执行操作回复时恢复到任意时间点。之后从复制副本日志中读取IO,并重新写入到复制副本的VMDK。在复制过程当中,有本地复制和远程复制两种。

p6.png

图六

远程复制中, 需要两个RecoverPoint for VM站点,而且需要两个站点通过WAN网络彼此连接。生产站点的IO流程就正如本地复制的IO流程一样,此外灾备站点上的虚拟RPA会将写IO的一份拷贝发送到日志,从而使用户能够在另外一个站点访问恢复到任意时间点的VMDK.

p7.png

图七

RecoverPoint for VMs不限制存储类型,它可以保护位于任何VMware数据存储区上的虚拟机。用于生产的数据存储区将置于满足虚拟机工作负载和性能需求的存储之上。对于复制副本虚拟机而言,选择目标数据存储区同样如此。

在部署RecoverPoint for VMs站点过程中,将会创建虚拟存储卷。它是数据存储区上 用于保存群集配置信息的VMDK 文件。存储库文件大小最小为6GB

  • 拟日志卷

p8.png

图八

日志卷有两种类型:生产日志和拷贝日志。每个日志卷在其容量许可范围内保留尽可能多的时间点快照(snapshot)。将删除最早的快照,以便为最新的快照腾出空间。日志包含RP站点中所有VRPA都能访问的数据存储区上的一个或多个虚拟卷。可以在不影响复制的情况下增加空间,以存储更长的历史记录。

日志卷也以VMDK文件的格式存储到数据存储区上。一致性组中的每份虚拟机拷贝(包括生产虚拟机)都必须包含一个或多个专用于保存相应虚拟机的时间点历史记录的日志卷。 日志所需的性能和传统RecoverPoint中的计算结果相同。每个拷贝的最小大小为10 GB 最大为10 TB。日志包含用于标记模式的数据区域和位图区域持续快照。 如果可能,应分配专用的日志数据存储区,以便对生产IO和日志IO进行分离。每个虚拟机可使用多个日志卷,以提高性能。

日志卷的大小基于以下几个因素: 受保护数据的更改率,需要的保护窗口和保留期,时间点快照之间的时间量,以及所保留的时间点快照数量。


更多有关RecoverPoint for VMs的管理界面描述,请参考我们的管理文档:

https://support.emc.com/docu59891_RecoverPoint_for_Virtual_Machines_4.3_Administrator

https://support.emc.com/docu56302_RecoverPoint_for_Virtual_Machines_4.2_Administrator

28 消息

2016年12月13日 16:00

曾经有最终用户这么对我说过,我的数据在存储上有很好的保护啦,RAID 5,还需要备份干嘛,这样的用户更不用说使用RP这样的产品啦。怎样说服或者说改变他的观念呢?

11 消息

2016年12月13日 18:00

RAID 5仅仅是存储层面上对数据块的保护。避免数据块的损坏能够对0和1进行恢复。这个保护功能还是比较局限的。而复制产品比如RecoverPoint是应用层面上的保护。比如当站点出现电源损坏或者意外掉电的情况,能够通过RP在另外一个站点,或者另外一个拷贝访问。

其次,比如用户需要对数据进行开发和测试,通过RP可以本地访问和远程访问,灵活的切换站点测试。比如数据出现错误或者误删,通过RP的快照回滚功能能够实时访问任意时间点的快照。和其他复制产品的优势就在这里,而相比RAID 5 来说,这类复制产品的数据保护功能更强大,针对整个应用程序来说的。

找不到事件!

Top