开始新对话

此帖子已超过 5 年

Solved!

Go to Solution

10378

2012年6月3日 03:00

请教ALUA的解释以及其对LUN trespass的影响

就EMC的VNX或clariion而言,哪位大侠能帮忙具体解释下ALUA(Asymmetric Logical Unit Access)以及其对LUN trespass的影响,如能举些实际的例子来帮助理解就最好了。最近在学习些相关的材料,这方面知识点还不是太清楚。新人求助,先谢谢了

106 消息

2012年6月4日 02:00

主机到存储之间的链路故障切换,在不同的情况下有不同的处理:

1. 在主机到当前有IO的SP的所有链路都发生故障(前端故障,比如FC线被拔掉,端口故障), 但两个SP都是工作正常的情况下, 启用了ALUA的存储不会引起LUN Trespass, 而没有启动ALUA的存储, 在主机端安装了powerpath的情况下,有IO的LUN会做trespass, 没有IO访问的LUN保持原位. 在有IO的时候才做respass. 在没有安装powerpath的情况下, 访问会中断.

2. 存储控制器到后端存储磁盘的链路发生故障(后端故障,比如LCC卡故障,或是后端连线断开), 和前端相同,启用了ALUA的存储, 不会trespass LUN, 而未启用ALUA的存储, 依靠powerpath的监控去trspass相对应的LUN.

3. 如果SP本身故障(重启或人为移除), 故障SP上的所有的LUN都会trespass到另一个SP. 这个操作也依赖LUN的一个参数: Auto asign.

1.4K 消息

2012年6月3日 22:00

ALUA 是CLARIION 从R26开始引入的一个新的Feature,旨在模拟A/A架构的存储,减少Trespass。

举个例子,LUN01 own在SPA,但由于某些原因,I/O请求从SPB进来,这个时候,ALUA会试图将I/O从SPB重定向到SPA由SPA进行处理后再按原路返回给主机。可见,这种路径对性能是有影响的,但至少不会因为trespass带来短暂的中断。另外,如果重定向的I/O数量达到一定的阈值后,存储会认为原来的路径已经“完全死亡”,不在期望其恢复,所以会触发trespass把LUN01切换到SPB。

总而言之,ALUA是A/P存储模拟A/A存储的一种方法,减少trespass对生产带来的影响。但从物理架构上来说,A/P存储终究还是A/P,能处理I/O的SP永远只是该LUN的owner。

19 消息

2012年6月5日 06:00

感谢两位的回复!根据两位提供的指导,我又整理下头绪,还做了张图和表格,请再帮忙看下我的理解对不对。

1. ALUA是个好功能,能减少发生LUN trespass情况的次数。LUN trespass如果发生,会对用户端有影响的是吧?所以,ALUA没理由不开启对吧?有理由关闭ALUA吗?

2. VNX里默认是开启ALUA的对吗?在ALUA开启的前提下,在主机到SP的链路故障或者SP到后端存储故障时(假设SP本身没故障),都不会发生LUN trespass,不管主机端有没有装powerpath。这样的话,是不是说有没有powerpath也无所谓了呢?

另外,画了张图,标出了5条链路,链路1是主机到SPA,链路2是主机到SPB,链路3是SPA到后端存储,链路4是SPB到后端存储,链路5是SPA和SPB间的通路。并且假设LUN01的默认owner在SPA上。

还结合图做了张表格,请帮忙看下表格里我的理解对不对。再次感谢!

ALUA.jpg 

链路故障.jpg

106 消息

2012年6月5日 10:00

你在这里讲的链路实际上是连接,并不是真正的path.

path链路是从主机到LUN的访问的通路, 在你的这个连接方式下, 一共只有两条链路.

不过你分析的结果应该是差不多的.

但有些不对. 在开启ALUA的时候,连接1路障时的访问是2-5-1, 连接3路障是1-5-4, 这是官方文档的对ALUA的说明,实际效果还要测试. 在连接3路障的时候,2连接也应该是有IO的. 这两种情况都不会trespass LUN.

有一些情况有可能不开启ALUA, 就是主机的链路管理软件或存储系统不支持ALUA的情况下.

ALUA是在存储的Flare版本在R26以后才支持的.

而也不是所有的powerpath版本都支持ALUA, 要查询支持手册.

另, SPA和SPB之间做数据交换的通路是CMI ( CLARiiON Messaging Interface).

还有,在启用了ALUA, 并且powerpath有完全的license的情况下,正常运行中, 主机到两个SP的前端都会有IO. 而后端只有LUN的owner这边有IO. 这是实测的结果.

19 消息

2012年6月7日 22:00

谢谢,很有帮助:)

32 消息

2013年1月9日 07:00

谢谢,学习了,正遇到trespass问题。

3.2K 消息

2013年1月9日 16:00

如果不差钱就直接买symmetrix吧多省心。

146 消息

2013年1月9日 19:00

关于ALUA有几个疑问:

1、如果failover的模式是ALUA,正常情况下,IO是负载到所有的前端路径到达SP吗?还是说只有在owner SP的路径fail的情况下才启用ALUA,平时IO只是落在owner SP上?如何判定呢?

2、在IO通过peer SP到owner SP的过程中是通过CMI传输吗?跟write mirror的同步路径是一样的吗?

3、SP到后端磁盘路径出现问题,也可以使用ALUA吗?是不是数据落地的时候这样:owner SP cache->peer SP bus->disk,read disk的时候正好相反?

4、ALUA的模式和日立AMS的A/A,有什么区别和联系吗?

1.4K 消息

2013年1月9日 23:00

1. 是否会负载到前端所有SP取决于多路径软件,存储不做控制。ALUA是在接non-ower SP接到I/O的情况下,不做tespass,通过重定向组件把I/O交给owner-SP处理,再通过原路径返回。

2. 是走CMI

3. 可以,走lower redirector -> CMI -> peer sp,再返回

4. 不懂AMS,ALUA只是模拟A/A架构,但其实不是,目的就是为了减少trespass带来的瞬断。

146 消息

2013年1月10日 01:00

1、多路径软件是powerpath,failover选择ALUA的情况下,正常IO怎么负载?

3、没太明白。我的意思是如果后端的owner SP的bus连接出现问题,那么如果cache flush数据或者从disk读数据的过程怎样?

P.S. 有相关的手册说这个东东吗?

913 消息

2013年1月10日 01:00

学习!

1.4K 消息

2013年1月10日 17:00

3. 如果后端 owner SP bus故障,I/O会被owner SP的lower redirector通过CMI重定向到Peer SP,Peer SP从backend拿数据按原路返回给ownerSP,owner-SP处理完I/O将结果返回给Host。置于Cache Flush,由于Write Cache是Mirror的,Peer SP可以做Flush的操作。

1.4K 消息

2013年1月10日 19:00

客气了,互相探讨!

146 消息

2013年1月10日 19:00

学习了,谢谢阿超!以后多指教啊,呵呵!

5 Practitioner

 • 

274.2K 消息

2013年1月10日 19:00

个人理解Trespass就是LUN的Owner发生了变化,这会导致应用IO中断;

而ALUA是A/P架构模拟A/A架构,但是最终LUN IO的处理都是其原来的SP Owner,但是会通过Peer SP出去回到主机。

还想请教一个问题: Trespass导致IO中断,会导致应用中断嘛?还是导致应用超时?IO中断会对应用造成多大的影响?

找不到事件!

Top