Highlighted
KRhelen
3 Silver

【专家问答】EMC存储和主机的亲密接触

好消息,新一期的“专家问答”活动正式开启。本期开设的是主机关联问题专场,从2月22日至3月6日(周日)期间,由三位主机方面的资深技术专家,和大家一起讨论和分享EMC存储产品与主机之间会发生的各种话题。不论您有任何这方面相关问题,我们的专家照单全收,与您畅快切磋!


以往所有已完成的“专家问答”活动可参考这个汇总贴

本期讨论主题:EMC存储和主机的亲密接触

本期持续时间:2016年2月22日 – 3月6日。活动结束后,本贴将锁定,有相关的后续问题可开新贴提问。


本期我们邀请到的专家是:


Tisha Luo.jpg


Tisha Luo(罗婷)

目前就职于EMC全球技术支持中心UNIX主机组,从事远程技术支持工作近3年。熟悉各Unix操作系统上的磁盘管理和相关问题解决,以及EMC Symmetrix存储的管理。目前主要负责多路径软件PowerPath,Symetrix存储管理软件 Solutions Enabler,以及Server-Based SAN软件产品ScaleIO的技术支持。








陈朝阳.png


陈朝阳


EMC资深技术专家,目前就职于上海EMC全球支持中心,从事远程技术支持工作10年。熟悉操作系统,网络以及存储。目前主要处理EMC存储的主机连接,Symmetrix的管理以及灾备处理。







Lin Yan.png


林焱


EMC资深技术专家,目前就职于EMC全球支持中心。熟悉LINUX/VMware磁盘访问实践和故障分析。目前主要负责EMC存储主机连接故障排错,以及基于VMware VSAN超融合产品(VSPEX BLUE/VxRail)和基于VMware vRA EHC 产品技术支持。





和专家交流,与同行畅谈。欢迎大家以回帖的方式就EMC和主机关联的相关问题,来积极提问和踊跃发表自己的意见。期待您的参与!

标签 (1)
0 项奖励
22 条回复22
版主
版主

Re: 【专家问答】EMC存储和主机的亲密接触

本期专家问答活动已正式开启,大家有任何关于 主机和EMC存储 相关的问题,欢迎回帖来提问并和专家互动

0 项奖励
czybox
1 Nickel

Re: 【专家问答】EMC存储和主机的亲密接触

大家好!

先简单描述一下吧。EMC的存储被广泛用在各个系统里。所以,针对每个操作系统,EMC都会有对应的连接指南。这个文档一般也是大家在做主机相连的时候需要第一参考的。

针对EMC存储连接Windows的连接指南。

https://support.emc.com/docu5134_Host-Connectivity-Guide-for-Windows.pdf?language=en_US

针对EMC存储连接Linux的连接指南。

https://support.emc.com/docu5128_Host-Connectivity-Guide-for-Linux.pdf?language=en_US

针对EMC存储连接ESX(i)的连接指南

https://support.emc.com/docu5265_Host-Connectivity-Guide-for-VMWare-ESX-Server.pdf?language=en_US

针对EMC存储连接AIX的连接指南

https://support.emc.com/docu5126_Host-Connectivity-Guide-for-IBM-AIX.pdf?language=en_US

其他平台的连接指南,您都可以在support.emc.com上搜索到。

Roger_Wu
4 Ruthenium

Re: 【专家问答】EMC存储和主机的亲密接触

三位专家好!

想问个问题,不少用户的主机、操作系统、存储甚至还有网络设备是来自几家不同的厂商,当主机与存储之间出现问题时,用户一般是先联系哪个厂商比较好呢?有没有一个通用的checklist来帮助缩小范围?还是说这样的问题,我们都建议一上来就联系所有的厂商?谢谢!

0 项奖励
czybox
1 Nickel

Re: 【专家问答】EMC存储和主机的亲密接触

Roger,你好!

一般来说,是基于客户的初始判断,给他/她所怀疑的设备所在厂商,或者他们的集成服务提供商开case。我们会经常遇到开过来的case,最后问题不在EMC相关的产品上。但即使这种情况,我们还是有责任帮助客户缩小问题区域,指引到正确的支持厂商去。

当然,很多客户上case是基于有没有服务。比如有些用户暂时没有Windows的支持协议,遇到问题了。不管什么问题,先开到EMC再说。这种情况我们不推荐,但我们也尽我们所能回答客户问题,因为我们希望客户在使用EMC产品的整个solution中,有良好的体验与服务。

eric_wang2
1 Nickel

Re: 【专家问答】EMC存储和主机的亲密接触

各位专家好:

    solaris系统powerpath管理磁盘与solaris系统format出来的盘符不一致问题,现在是否解决?

    eg: powerpath管理的的盘符为emcpower0a,而系统format出来的盘符为emcpower0h.

         造成创建分区或lable需要使用format出来的盘符,而加入zfs pool需要使用powerpath的盘符,虽然是同一块磁盘,但造成管理不便,部分客户也不太理解,解释费劲.

0 项奖励
Roger_Wu
4 Ruthenium

Re: 【专家问答】EMC存储和主机的亲密接触

非常感谢!

0 项奖励
link4
1 Copper

Re: 【专家问答】EMC存储和主机的亲密接触

在Solaris中,PowerPath的聚合盘显示依然是这样的。

这里的a-h都是对应Solaris Disk Slice的编号。

Solaris中,对于PowerPath而言,始终使用 emcpowerXa的格式来输出聚合盘的名称。

而format的行为则不同,format会将磁盘在/dev/rdsk目录下所有对应的slice扫一遍,再根据/dev/rdsk扫出来的结果来生成聚合设备名字,因而不一定会用slice a来表示。

可以进一步参考EMC KB: https://support.emc.com/kb/429465 有针对这个问题进一步解释。

0 项奖励
czybox
1 Nickel

Re: 【专家问答】EMC存储和主机的亲密接触

主机和存储的相连中,多路径的选择是重要一环。Windows平台上,多路径的软件很多。大的存储厂商一般都有自己的多路径软件,并且基本都能管理其它存储厂商的主流存储。Windows平台上,有一个好处,就是微软集中实现了MPIO。三方厂商(包括EMC,甚至纯粹的软件公司Verita)的多路径软件只要实现对应的DSM以及其他的一些高级功能即可。微软甚至也提供了通用DSM,其可以直接管理主流存储的多路径。

-选择微软MPIO(plus Microsoft generic DSM,以后就简称MPIO)还是EMC Powerpath?

毫无疑问,两者现在都能正确的管理连接到EMC各种存储的多路径。选择谁取决于您是否有(不管是购买还是赠送)Powerpath的license。Powerpath没有license,就只能工作在基本的basic failover模式下。这种模式,不管你真正有多少条路径,只会选择两条路径然后提供failover的功能,没有load balance的功能。这种情况下,MPIO应该是你的选择,它提供更多的选择以及load balance。但当您有了powerpath的license。那还是建议您使用Powerpath。Powerpath针对每个EMC存储的前端特点做了优化,充分实现failover和load balance功能。还有其他一些充分利用硬件的特性。

-同一主机连接多个厂商的存储怎么办?

之前提到,实际上主流的多路径软件都可以管理三方厂商的存储。所以您可以选择一款合适的多路径软件在管理所有存储. 拿Powerpath举例,您安装的时候选择定制,就可以列出下面的支持列表(EMC VNX/Clariion和Symmetrix是自带就支持的,没有显示在下面的列表里)

1.png

那,如果用户一定要每个厂商存储都有各自的多路径软件管理,可以么?这也是可以的,只要大家都是基于MPIO框架开发。下面就是一个列表以及相关的要求。

2.png

更多关于Powerpath在Windows上的安装和管理,请参考。

https://support.emc.com/docu56541_PowerPath-and-PowerPath-VE-for-Microsoft-Windows-6.0-and-Minor-Rel...


luot2
1 Nickel

Re: 【专家问答】EMC存储和主机的亲密接触

大家好!

今天我想和大家分享一个比较常见的Symmetirx磁盘报SCSI Reservation Conflict的问题的处理过程,这种问题常见于AIXLinuxESXi,报错形式如下:

[AIX-errpt]

65DE6DE3 1027142115 P S hdisk2 REQUESTED OPERATION CANNOT BE PERFORMED

65DE6DE3 1027142115 P S hdisk14 REQUESTED OPERATION CANNOT BE PERFORMED

[Linux-messages]

Jan  8 20:45:32 xxxx kernel: sd 1:0:3:52: reservation conflict

Jan  8 20:45:32 xxxxx kernel: sd 0:0:3:52: reservation conflict

[ESXi-vmkernel]

WARNING: SCSI: 5532: Failing I/O due to too many reservation conflicts
WARNING: SCSI: 5628: status SCSI reservation conflict, rstatus 0xc0de01 for vmhba1:0:7. residual R 919, CR 0, ER 3
WARNING: J3: 1970: Error committing txn to slot 0: SCSI reservation conflict

首先,我先介绍一下SCSI Reservation的基本概念。在一个共享存储的环境下,多台主机共享多个物理Lun,当某一个主机在对某一个Lun进行写操作时,为了防止其他主机意外地也对这个Lun进行写操作引起的数据损坏,就引入了SCSI Reservation的机制。该机制是通过当前需要读写这个Lun的主机在Lun上放置SCSI锁,来阻止其他主机再对这个Lun进行读写操作。SCSI锁的具体放置时间和释放时间要取决于具体的操作系统和应用,例如,在AIX主机中,如果Lun是在LVM中使用,那么LunSCSI锁一般是在varyonvg操作时被放置,一般会在varyoffvg时被释放。当一个Lun上有主机A放置的SCSI锁,如果主机B也尝试访问这个Lun,那么在主机B上就会报这种SCSI Reservation Conflict的错误。另外,除了EMCSymmetrix存储外,其他的一些EMC产品也支持SCSI Reservation,例如VNX/CLARiiONVplexXtremIO 

接下来,我将阐述在主机上看到Symmetrix磁盘报SCSI Reservation Conflict的错误时的处理过程。首先,要根据自己的实际使用情况,判断报错的这个主机B在报错时间是否应该访问这个Lun

  1. 如果主机B本就不应该在该时间访问该Lun,那么这个报错就是正常的,是符合工作机制的,可以忽略。
  2. 如果主机B在该时间应该有访问该Lun的需求,那就需要进一步去分析报错的原因,这种情况也是我们日常在帮助客户处理问题时最常见的,解决思路如下:

        1) 在安装了SE的主机上使用symdev -sid xxx list -resv命令列出这个存储上所有有SCSI锁的磁盘,在输出中查找是否有报SCSI Reservation Conflict错的Lun,来确认当前该Lun上有无SCSI锁。然后,联系我们的Symmetrix产品支持工程师拨到存储上,用inline的命令去进一步确认该Lun上当前有无SCSI锁,如果有的话,是哪个HBA放置的。

        2)在确认有锁及放置该锁的HBA之后,客户需要找出放置该锁的HBA所在的主机A,然后查看主机A当前是否正在访问这个Lun,在确认主机A没有对该Lun进行I/O时,我们可以开始清除这个SCSI锁,清除锁的具体方法如下:

         a.使用以下SE的命令来清除锁。

symdg create testdg

symld -g testdg add dev 3C2 -sid 32

symdg show testdg(输出如下)

……

Standard (STD) Devices (1):
        {
--------------------------------------------------------------------
Sym Cap
LdevName PdevName Dev  Att. Sts     (MB)
--------------------------------------------------------------------
DEV001 /dev/rhdisk6 03C2      RW      2033
        }

symld -g testdg break DEV001 –nop(解锁的命令)

再使用symdev -sid 32 list -resv验证该磁盘的锁是否被成功清除。

b.如果使用a中的SE命令无法清除锁,则需要联系我们的Symmetrix产品支持工程师拨到存储上,使用inline命令清除。