Highlighted
Roger_Wu
5 Tungsten

【专家问答(翻译稿)】ViPR SRM网络拓扑图和查询最佳实践

欢迎来到EMC技术社区“专家问答”活动。本次专家问答同步翻译自英文论坛的Ask The Export活动:Ask the Expert: Best Practice for fixing ViPR SRM Topology Maps and Queries on it


本次活动我们将探讨SRM监控和报表中的网络拓扑图(topology maps)的设备寻找及相关问题处理,以及分析SRM的拓扑查找和数据收集是如何工作的。我们的专家们还会就各种查询问题回答大家的疑问。


活动起止日期:2015/12/28 - 2016/01/15

邀请专家:

Krishna.Yalamanchi.png

Krishna Yalamanchi

Technical Support Engineer III

Krishna是EMC India ASD (Advanced Software Division)部门的工程师,在SRM支持团队工作已有三年,在ECC、ProSphere和UIM等产品上拥有丰富的经验。在这之前他在CLARiiON支持团队工作。

profile-image-display.jspa?imageID=16475&size=350

Gnanendra Reddy

Associate Principal Engineer

Gnanendra在完成其云计算硕士学位后就加入了EMC,工作至今已有5年。在此期间,他帮助搭建了不少站点,协助PS和SRM团队处理升级项目和客户的需求。

标签 (1)
0 项奖励
4 条回复4
Roger_Wu
5 Tungsten

Re: 【专家问答(翻译稿)】ViPR SRM网络拓扑图和查询最佳实践

英文专家问答活动同步进行中,大家可以在这里留下想问的问题,我们会帮忙翻译到英文活动帖中哦~

0 项奖励
Roger_Wu
5 Tungsten

Re: 【专家问答(翻译稿)】ViPR SRM网络拓扑图和查询最佳实践

用户 Sean Larkin 提问:

Topology Map会有哪些问题?我们需要做哪些步骤来处理这些问题?还有,如何保证多次查询下数据的一致性?

Krishna 回答:

Topology Map有很故障场景,我列举其中的一些:

1. Map上不显示对象(主机、阵列、交换机)

2. Map上进显示一部分对象

3. Map上不显示被动查找的主机

4. 升级SRM版本后,Map上不显示对象

从SRM 3.6版本起,引入了Diagnostic UI (故障分析界面)来帮助分析和恢复类似问题。这一功能对Topology Service和Topology-Mappping-Service都有效。

Diagnostic UI可以通过如下链接进入:

https://<primaryBE_hostname>:48443/Backends/Topology-service/Default/diagnostics/ui

https://<collector_hostname>:48443/Backends/Topology-Mapping-Service/Default/diagnostics/ui

访问上面两个链接,你可以找到被发现对象的一些原始参数,这样可以方便我们进一步排错。

对于3.6之前版本的SRM,我们可以用SPARQL查询来获取拓扑数据。

0 项奖励
Roger_Wu
5 Tungsten

Re: 【专家问答(翻译稿)】ViPR SRM网络拓扑图和查询最佳实践

Gnan 补充上一个问题道:

从3.6版本开始在前端主机上就没有Maps服务了。前端设备会直接查询Topology数据库并最终生成并显示拓扑图。

一些基本的排错技巧包括:

1. 主机上的SNIA库应该是最新的,并且能被SRM找到

2. 有时Topology Mapping Service (Collector Host信息收集主机)可能未能和Topology Service (主后端)同步,这时可以通过手动操作来触发同步,URL是https://<collector_hostname>:48443/Backends/Topology-Mapping-Service/Default/diagnostics/ui,并点击Resynchronize按钮。

3. 如果想要查看Topology数据库中的对象,可以通过此URL查询:https://<primaryBE_hostname>:48443/Backends/Topology-service/Default/diagnostics/ui,点击Launch Explorer。

另外通用的排错步骤如下:

1. 确认后端设备名称是否正确:

     cat /opt/APG/Backends/Topology-Mapping-Service/Default/conf/tmsconfig.xml

     <host>Primary Backend Name</host>

2. 如果拓扑图不可用,可以通过删除信息收集主机的data目录来尝试刷新Topology数据库

     i. 停止Collector Host上的所有服务

     ii. 进入/opt/APG/Backends/Topology-Mapping-Service/Default并删除所有文件夹

     iii. 重启所有服务

3. 编辑/opt/APG/Backends/Topology-Mapping-Service/Default/topology-mapping-service.properties并将com.emc.srm.topology.mapping-service.rawValueRDFUpdateManager.ignoreAction=false参数改为true。这一参数可以忽略原始标记强制启用mapping服务

4. 如果问题最终需要EMC售后来解决,可以收集下面这些日志:

     i. Collector、PBE和前端主机上的Diagnostic日志

     ii. Collector主机上的运行日志拷贝:/opt/APG/Backends/Topology-Mapping-Service/Default/data/topology/local /LocalStore.jnl

0 项奖励
Roger_Wu
5 Tungsten

Re: 【专家问答(翻译稿)】ViPR SRM网络拓扑图和查询最佳实践

用户 littlefinger 提问:

Topology Map如何在IBM VIO服务器和LPARS客户端下工作的?为何我这里只显示主机,而不显示端到端存储连通性信息?

Dan 回答:

你是否同时查找了物理主机IP和IBM LPAR SP?

littlefinger 表示已经查找过了。但是他发现Disk Information不在查找结果里。

Raghu 就提醒如果无法看到HBA表,那就确认主机端的SNIA库是否正确。在分析完用户上传的日志后,Krishna 从中发现了不少错误:

" unable to find valid certification path to requested target"

" Error while connecting to WinRM host SSEXMSP1.gwl.bz"

"PKIX path building failed: sun.security.provider.certpath.SunCertPathBuilderException: unable to find valid certification path to requested target."

Krishna 建议运行inq-snia_test来确认SNIA库是否正确。这个问题一般需要进一步分析,建议收集日志后联系EMC售后开一个case。日志收集方法:

perl ./LunMappingDetection.pl support=/tmp/<servername>_log.txt.

0 项奖励