Loin_Shi
1 Nickel

请教ALUA的解释以及其对LUN trespass的影响

转到解答

就EMC的VNX或clariion而言,哪位大侠能帮忙具体解释下ALUA(Asymmetric Logical Unit Access)以及其对LUN trespass的影响,如能举些实际的例子来帮助理解就最好了。最近在学习些相关的材料,这方面知识点还不是太清楚。新人求助,先谢谢了

标签 (2)
标记 (2)
1 个已接受解答

已接受的解答
Celia_Lee
2 Iron

Re: 请教ALUA的解释以及其对LUN trespass的影响

转到解答

主机到存储之间的链路故障切换,在不同的情况下有不同的处理:

1. 在主机到当前有IO的SP的所有链路都发生故障(前端故障,比如FC线被拔掉,端口故障), 但两个SP都是工作正常的情况下, 启用了ALUA的存储不会引起LUN Trespass, 而没有启动ALUA的存储, 在主机端安装了powerpath的情况下,有IO的LUN会做trespass, 没有IO访问的LUN保持原位. 在有IO的时候才做respass. 在没有安装powerpath的情况下, 访问会中断.

2. 存储控制器到后端存储磁盘的链路发生故障(后端故障,比如LCC卡故障,或是后端连线断开), 和前端相同,启用了ALUA的存储, 不会trespass LUN, 而未启用ALUA的存储, 依靠powerpath的监控去trspass相对应的LUN.

3. 如果SP本身故障(重启或人为移除), 故障SP上的所有的LUN都会trespass到另一个SP. 这个操作也依赖LUN的一个参数: Auto asign.

0 项奖励
22 条回复22
zhouzengchao
4 Germanium

Re: 请教ALUA的解释以及其对LUN trespass的影响

转到解答

ALUA 是CLARIION 从R26开始引入的一个新的Feature,旨在模拟A/A架构的存储,减少Trespass。

举个例子,LUN01 own在SPA,但由于某些原因,I/O请求从SPB进来,这个时候,ALUA会试图将I/O从SPB重定向到SPA由SPA进行处理后再按原路返回给主机。可见,这种路径对性能是有影响的,但至少不会因为trespass带来短暂的中断。另外,如果重定向的I/O数量达到一定的阈值后,存储会认为原来的路径已经“完全死亡”,不在期望其恢复,所以会触发trespass把LUN01切换到SPB。

总而言之,ALUA是A/P存储模拟A/A存储的一种方法,减少trespass对生产带来的影响。但从物理架构上来说,A/P存储终究还是A/P,能处理I/O的SP永远只是该LUN的owner。

Celia_Lee
2 Iron

Re: 请教ALUA的解释以及其对LUN trespass的影响

转到解答

主机到存储之间的链路故障切换,在不同的情况下有不同的处理:

1. 在主机到当前有IO的SP的所有链路都发生故障(前端故障,比如FC线被拔掉,端口故障), 但两个SP都是工作正常的情况下, 启用了ALUA的存储不会引起LUN Trespass, 而没有启动ALUA的存储, 在主机端安装了powerpath的情况下,有IO的LUN会做trespass, 没有IO访问的LUN保持原位. 在有IO的时候才做respass. 在没有安装powerpath的情况下, 访问会中断.

2. 存储控制器到后端存储磁盘的链路发生故障(后端故障,比如LCC卡故障,或是后端连线断开), 和前端相同,启用了ALUA的存储, 不会trespass LUN, 而未启用ALUA的存储, 依靠powerpath的监控去trspass相对应的LUN.

3. 如果SP本身故障(重启或人为移除), 故障SP上的所有的LUN都会trespass到另一个SP. 这个操作也依赖LUN的一个参数: Auto asign.

0 项奖励
Loin_Shi
1 Nickel

Re: 请教ALUA的解释以及其对LUN trespass的影响

转到解答

感谢两位的回复!根据两位提供的指导,我又整理下头绪,还做了张图和表格,请再帮忙看下我的理解对不对。

1. ALUA是个好功能,能减少发生LUN trespass情况的次数。LUN trespass如果发生,会对用户端有影响的是吧?所以,ALUA没理由不开启对吧?有理由关闭ALUA吗?

2. VNX里默认是开启ALUA的对吗?在ALUA开启的前提下,在主机到SP的链路故障或者SP到后端存储故障时(假设SP本身没故障),都不会发生LUN trespass,不管主机端有没有装powerpath。这样的话,是不是说有没有powerpath也无所谓了呢?

另外,画了张图,标出了5条链路,链路1是主机到SPA,链路2是主机到SPB,链路3是SPA到后端存储,链路4是SPB到后端存储,链路5是SPA和SPB间的通路。并且假设LUN01的默认owner在SPA上。

还结合图做了张表格,请帮忙看下表格里我的理解对不对。再次感谢!

ALUA.jpg 

链路故障.jpg

0 项奖励
Highlighted
Celia_Lee
2 Iron

Re: 请教ALUA的解释以及其对LUN trespass的影响

转到解答

你在这里讲的链路实际上是连接,并不是真正的path.

path链路是从主机到LUN的访问的通路, 在你的这个连接方式下, 一共只有两条链路.

不过你分析的结果应该是差不多的.

但有些不对. 在开启ALUA的时候,连接1路障时的访问是2-5-1, 连接3路障是1-5-4, 这是官方文档的对ALUA的说明,实际效果还要测试. 在连接3路障的时候,2连接也应该是有IO的. 这两种情况都不会trespass LUN.

有一些情况有可能不开启ALUA, 就是主机的链路管理软件或存储系统不支持ALUA的情况下.

ALUA是在存储的Flare版本在R26以后才支持的.

而也不是所有的powerpath版本都支持ALUA, 要查询支持手册.

另, SPA和SPB之间做数据交换的通路是CMI ( CLARiiON Messaging Interface).

还有,在启用了ALUA, 并且powerpath有完全的license的情况下,正常运行中, 主机到两个SP的前端都会有IO. 而后端只有LUN的owner这边有IO. 这是实测的结果.

Loin_Shi
1 Nickel

Re: 请教ALUA的解释以及其对LUN trespass的影响

转到解答

谢谢,很有帮助:)

0 项奖励
AndyWang1
1 Nickel

Re: 请教ALUA的解释以及其对LUN trespass的影响

转到解答

谢谢,学习了,正遇到trespass问题。

0 项奖励
liulei_it
5 Tungsten

Re: 请教ALUA的解释以及其对LUN trespass的影响

转到解答

如果不差钱就直接买symmetrix吧多省心。

0 项奖励
Chao_Ma
2 Iron

Re: 请教ALUA的解释以及其对LUN trespass的影响

转到解答

关于ALUA有几个疑问:

1、如果failover的模式是ALUA,正常情况下,IO是负载到所有的前端路径到达SP吗?还是说只有在owner SP的路径fail的情况下才启用ALUA,平时IO只是落在owner SP上?如何判定呢?

2、在IO通过peer SP到owner SP的过程中是通过CMI传输吗?跟write mirror的同步路径是一样的吗?

3、SP到后端磁盘路径出现问题,也可以使用ALUA吗?是不是数据落地的时候这样:owner SP cache->peer SP bus->disk,read disk的时候正好相反?

4、ALUA的模式和日立AMS的A/A,有什么区别和联系吗?

0 项奖励
zhouzengchao
4 Germanium

Re: 请教ALUA的解释以及其对LUN trespass的影响

转到解答

1. 是否会负载到前端所有SP取决于多路径软件,存储不做控制。ALUA是在接non-ower SP接到I/O的情况下,不做tespass,通过重定向组件把I/O交给owner-SP处理,再通过原路径返回。

2. 是走CMI

3. 可以,走lower redirector -> CMI -> peer sp,再返回

4. 不懂AMS,ALUA只是模拟A/A架构,但其实不是,目的就是为了减少trespass带来的瞬断。

0 项奖励