Highlighted
2 Bronze

trespassed 是什么故障

我在用一个EMC存储,NS120,登录网页管理界面看到很多告警。截图如下

搜狗截图_2012-07-02_14-30-05.png

这只是一部分告警,一共有60多个,而且7天报警一次,好像是定期检查一样,每次都是这两个盘:

CriticalJun 17, 2012 9:31:57 AMLocalemcnas_120NaviEventMonitorDisk d11 has been trespassed.0x12608a0065
CriticalJun 17, 2012 9:31:57 AMLocalemcnas_120NaviEventMonitorDisk d12 has been trespassed.0x12608a0065

大家有遇到过这个问题吗,可能是硬件问题导致的吗?多谢帮助

标签 (1)
回复
14 条回复14
Highlighted
4 Beryllium

Re: trespassed 是什么故障

Trespass是指NAS后端的LUN从一个控制器切换到了另一个控制器,很有可能是链接断开导致的,也有可能是控制器发生了重启等后端事件。建议查看事件日志确定Trepass之前存储发生了什么,才能确定根本原因。

回复
Highlighted
2 Bronze

Re: trespassed 是什么故障

多谢回复,能给我详细一点的指导吗,如何获得相关的事件日志?

回复
Highlighted
4 Beryllium

Re: trespassed 是什么故障

你可以用 nas_logviewer /nas/log/sys_log | more 命令去查看相应时间段发生的事件,如你需要联系EMC技术支持分析日志的话,日志的收集方式可以参考下面的文档:

https://community.emc.com/docs/DOC-15756

https://community.emc.com/docs/DOC-15759

回复
Highlighted
版主
版主

Re: trespassed 是什么故障

对,就像楼上说的,要具体分析的话,还得看log。

此外,论坛里以前也有一些关于存储系统里发生tresspass相关的讨论和文章,找了下供参考。希望有助于了解tresspass的一些原理:

LUN Trespass (切换) 的问题该从何入手?
https://community.emc.com/message/581426#581426

故障转移模式(Failover Mode)简介
https://community.emc.com/docs/DOC-16214

怎么知道具体哪个LUN发生了trespass?
https://community.emc.com/message/611914#611914

请教ALUA的解释以及其对LUN trespass的影响
https://community.emc.com/message/636762#636762

回复
Highlighted
2 Bronze

Re: trespassed 是什么故障

按回复检查了存储:看到有个LUN属于SPB,但是SPB是备用的SP。

搜狗截图_2013-01-09_22-42-31.png

SPB的log看到每7天有个SPS的测试,正好和trespass错误日志时间相符。

搜狗截图_2013-01-09_22-48-58.png

那请问,这个SPS测试就是直接原因了对吗?

本来该LUN是SPB控制访问的,SPS测试的时候SPB暂停访问,切换到SPA,于是有了错误日志,对不?

回复
Highlighted
3 Argentium

Re: trespassed 是什么故障

SPS testing不会导致trespass,具体原因得看SPCOLLECT。

回复
Highlighted
4 Tellurium

Re: trespassed 是什么故障

建议将默认的owner和当前owner调整一致咯!

回复
Highlighted
2 Bronze

Re: trespassed 是什么故障

1. 已经把owner调整了,现在所有LUN都是SPA的了。

2. 收集了SPB的日志,太多了,不知道从哪里寻找问题,高手能指个方向不?

3. 因为错误日志是7天一次,所以等到13号就知道是不是SPS测试导致的了。为啥SPA看不到SPS测试的Log?

搜狗截图_2013-01-10_20-11-47.png

回复
Highlighted
4 Beryllium

Re: trespassed 是什么故障

SPCollect没估计看不到太多的有用信息,只能找Support看,或者你自己有兴趣一个个解开看看有什么有用的东西。虽然你看到的情况是trespass与SPS测试一起发生,但依然不能说明有必然联系,建议找Support看为什么会trespass,猜是没用的。有些event只有SPB能看到,这是by design的,无需太纠结。

回复