开始新对话

未解决

此帖子已超过 5 年

9794

2013年6月24日 02:00

lun path dead

有个问题需要请教下大家 ,下面是描述:

一台DELL服务器通过二个2460单口HBA,二台交换机冗余连接二台EMC CX300,suse 9系统,现在发现IO响应很慢,不运行程序已经:

Device:    rrqm/s wrqm/s   r/s   w/s  rsec/s  wsec/s    rkB/s    wkB/s avgrq-sz avgqu-sz   await  svctm  %util

sda          0.06  26.52  0.43  1.14   13.30  221.34     6.65   110.67   148.84     1.79  227.01 632.91  99.77

sdb          0.00   0.00  0.00  0.00    0.00    0.00     0.00     0.00     8.00     0.00  469.38 469.38   0.00

sdc          0.00   0.00  0.00  0.00    0.00    0.00     0.00     0.00     8.60     0.00  192.48 188.60   0.00

无法运行程序。

下面是我的检查步骤,先抓取了DELL 硬件日志,查看没有明显问题,再查看 GDGZ-PB-TJ1-WAP20:~ # powernt display dev=all,里面有多个这种报错(有多个Lun):

Pseudo name=emcpowerbi

CLARiiON ID=CK200074400728 [GDGZ-PB-TJ1-WAP20]

Logical device ID=60060160EC901E0062EB0D45B945DE11 [LUN 12]

state=alive; policy=CLAROpt; priority=0; queued-IOs=0

Owner: default=SP A, current=SP A       Array failover mode: 1

==============================================================================

---------------- Host ---------------   - Stor -   -- I/O Path -  -- Stats ---

###  HW Path                I/O Paths    Interf.   Mode    State  Q-IOs Errors

==============================================================================

   4 qla2xxx                   sdaa      SP A0     active  alive      0      0

   4 qla2xxx                   sdai      SP B0     active  alive      0      0

   3 qla2xxx                   sdi       SP A1     active  alive      0   1460

   3 qla2xxx                   sds       SP B1     active  dead       0   1421

从这里看,一个链路感觉有问题,不知道是不是引起IO很高的原因,收集了二台EMC的日志,发现HBA连接注册都是正常,也没有报错,想请各位大侠帮忙分析下可能问题,以及下一步需要的解决思路,谢谢

2 Intern

 • 

1.4K 消息

2013年7月4日 21:00

换HBA后重新注册下,先删除(deregister)之前的,在手动创建;或者在Linux上安装Agent自动注册。

手动注册步骤如下(这是用于CX4的,CX300太老,找不到对应的,你可以参考CX4的步骤来做)

1. Navigate to the Array System Information.

2. Select the Storage System Connectivity Status option which is on the left panel.

3. Select the hosts,drill down to the initiator which needs to be registered.

4. Highlight the initiator and select " Register ".

5. Enter the Initiator Name, Initiator type, Failover mode.

6. Check Array commpath. Select New Host/ Existing Host accordingly.

7. Click OK. This would result in Success message.

2 Intern

 • 

4K 消息

2013年7月4日 21:00

交换机上如果之前用了别名来划分zone,那就改别名再重新激活配置。没有用别名的话,就要改所有zone的PWWN。

在存储上重新注册HBA (initiator)最好还是先删除之前的记录。一般只有在路径注册出现错误信息,或者需要彻底删除某个主机时"可能"需要进入工程师模式,日常操作的话不需要进入。

196 消息

2013年7月9日 19:00

谢谢各位大神给出的建议

昨天我在现场测试,重新插拔HBA卡无效,只能考虑更换HBA卡,根据各位的建议,换HBA卡后着重考虑zone的问题以及重新注册的问题,ZONE方面没有问题,因为当时是按端口做的别名,但是重新注册方面一直无法成功,导致现在的lun一直只有二条,这块HBA卡链路没有起效,下面贴出具体的现场情况:

1.我发现suse 主机里有anger存在,也就是说,过一会后,HBA卡自动注册了,但是它并没有自动属于我需要的storage group,我查看这个wwn的info,发现它属于系统自动生成的menagement (进入工程模式后能看到在原有的storage group下),见图0710-13

2.我进服务器系统,/etc/init.d/naviagent stop  关闭了anger,然后再接上服务器上这块HBA卡连线,此时机器未自动注册,下面是我当时的注册过程,请大家帮忙看下有问题没 (附件5)

3.手动注册后,我查看,还是有问题,这台机器本来的storage group组是 GDGZ-PB-TJ1-WAP20 ,我手动注册时选择存在的 host 也是它,但查看链路状态时发现它还是属于menagement 组,所以查看Host 连接状态时,除了本来有的二个storage group 外,还多出来个menagement 组来和EMC 相连,可能没有说清楚,多上图吧

4.查看正常的链路,它storage group 组应该是GDGZ-PB-TJ1-WAP20 的,如图7

5.查看menagement 属性,发现那块更换的HBAwwn 已经在它组里了,如图6 里,点击advance 看到的,里面二个WWN 打勾的状态

6.我尝试把这二个打勾去掉,然后进工程模式删除新注册的lun,重新按第2步注册 后还是一样的问题

7.再删除新注册的lun,这时二个HBA的wwn 那里显示未注册,查看menagement  storage group 组,还是看到这二个wwn已经属于它,我尝试先去掉勾选 ,发现无法去除,见图1,图0710-2 !

做到这里,实在迷糊了,问题还是没有解决,现在服务器查看链路只有二条,另外一块HBA卡的二条不见了,。。求教各位大神,我哪里做错了吗?

事情比较紧急,求各位帮忙看下,给点意见,非常感谢

5个附件

196 消息

2013年7月9日 19:00

还有一些图片一起上图:

先说明一下情况,我新更单换上的HBA卡wwn 是:尾数为  57: F8 ,故障HBA 卡wwn 为:D6:E1

主机为 GDGZ-PB-TJ1-WAP20 

在上面的尝试都做过后,最近重新删除新注册后,我没选择:主机右键-connectivity status - 选 中二台wwn -group edit initiators 注册,直接Register 一条一条注册,还是不行,直接报错,见图 0710-2

我当时是按文档上操作的,见图8

后面是一些现场拍下的图,作为参考

可能大家看的比较不方便,写的比较多,比较乱,主要是刚接触EMC,还不熟悉,可能很多表达不清楚,只能麻烦各位大神帮忙 了,非常感谢

5个附件

196 消息

2013年7月10日 01:00

各位大神请帮忙分析下吧,给点思路也好啦,谢了

2 Intern

 • 

4K 消息

2013年7月10日 02:00

Hi Qihua, 看到你在https://community.emc.com/thread/177862问了相同的问题,不如去新帖里讨论吧。我刚刚有回复了一下。

66 消息

2013年7月10日 06:00

这个是链路问题吧

找不到事件!

Top