开始新对话

未解决

此帖子已超过 5 年

J

13541

2013年4月18日 02:00

【专家问答第十期】Symmetrix的性能监控和分析

好消息,新一期的中文“专家问答”活动又将开启啦。


本期活动的技术话题为:Symmetrix的性能监控和分析。从2013年4月22日(周一)开始为期两周的时间里,我们将和大家一起讨论和分享关于此话题的经验和心得。以往所有已完成的“专家问答”活动可参考这个汇总贴

本期讨论主题:Symmetrix的性能监控和分析

本期持续时间:2013年4月22日 – 5月4日,为期两周。活动结束后,本贴将锁定,有相关的后续问题可开新贴提问。

本期我们邀请到的三位专家是: James Liu, Cecil Yan 和 Jessie Tang。


James_Liu_ATE.jpg

James Liu 20年从业经验,2000年加入EMC,从事Symmetrix售后技术支持工作,目前是EMC大中华区现场技术支持专家。

Cecil_Yan_ATE.JPG.jpg

Cecil Yan 目前就职于EMC中国售后技术支持部门,主要负责Symmetrix产品的技术支持,且在Performance,SRDF,Data Structure等相关领域有所见长。

Jessie_Tang_ATE.jpg


Jessie Tang 通过2010年校园招聘加入EMC,现任Symmetrix远程技术支持的工作。熟悉对于Symmetrix硬件结构、数据本地和远程复制等技术领域。。

和专家交流,与同行畅谈。欢迎大家以回帖的方式就“Symmetrix的性能监控和分析”这个主题,来积极提问和踊跃发表自己的意见。期待您的参与!

44 消息

2013年4月25日 01:00

没有硬件故障,没有SSD等影响,答案所需的所有条件都在贴子里了。

3.2K 消息

2013年4月25日 01:00

热点数据被自动转移到存储中的SSD 或者 cache 中了吧

18 消息

2013年4月25日 01:00

考虑机器故障原因吗?比如坏盘?

3.2K 消息

2013年4月25日 08:00

您的一句话

由于 Symmetrix 结构比较复杂,低负载时单个IO的响应时间肯定不及一些结构简单的存储,因此dd的成绩也不会很好,但是在大量的、并发的IO情况下,Symmetrix 的性能才能充分发挥出来

,,,, 要慢慢品味了.

12 消息

2013年4月26日 08:00

上午I/O来自于随机读写,而下午批量I/O是连续的?另外,Read miss也会导致平均IO响应时间变大。Cache或客户的app在上下午间有何调整么? 我想,你们应该已经分析过STP Log, 期待谜底。。。

3.2K 消息

2013年4月28日 15:00

偶在银行办业务的遭遇很像I/O在磁盘阵列中的遭遇.

偶一大早去银行排在了第7号,一开始前面几个都挺快的,但是第4、第5号都是持续的时间太长啦(可能大且连续的I/O吧)。到了偶前面一位第6号的时候,银行的工作人员不知由于什么原因在同一窗口同一时间连续叫了两个号,第6号、第7号(写操作缓存过量)?结果本来偶可以去另外的窗口的却被偶后面的第8号乃至第9号占据了。偶只好紧紧地盯紧这个第6号,终于等他办完业务立马占了他的位子(抢占资源)。

如同在磁盘阵列中造成的I/O等待类似。直到执行的那一时刻,系统永远不知道下一个I/O到底是什么,pre-fetch算法也不是万能的。这也是造成存储系统I/O瓶颈的一个原因吧。

44 消息

2013年4月29日 09:00

哈哈,这位同学真是爱思考、好学习,佩服佩服。

Cache算法确实是影响存储性能的很重要的因素,但Cache算法的优劣很难有一个量化的标准,也是存储系统里最神秘的东西之一。

据我观察,在连接Mainframe系统时,Cache命中率一般都高得不可思议,可能Mainframe的IO系统在主机上已经做了很好的优化,对于存储来讲更容易处理吧。

44 消息

2013年4月29日 09:00

你指出了很重要的一点,答案已经基本出来了。

44 消息

2013年4月29日 18:00

为了说明 “由于 Symmetrix 结构比较复杂,低负载时单个IO的响应时间肯定不及一些结构简单的存储,因此dd的成绩也不会很好,但是在大量的、并发的IO情况下,Symmetrix 的性能才能充分发挥出来” 这句话,配个图吧,这是几年前当时某两种存储的性能对比:

2013-04-30_030413.jpg

蓝军在dd大战中肯定能打败红军,如果总体IOPS的需求在20000以下,那么蓝军是个务实的选择,不一定非要红军不可。

相似的道理,PC机上Windows的操作体验明显好于Unix上的GUI,也不能说明PC机的性能好于Unix Server。

3.2K 消息

2013年4月30日 09:00

谢谢

不过还是猜不透天机,缺那最重要的1%。

1.6K 消息

2013年4月30日 10:00

James的这个问题很有意思啊,激发大家的思考

44 消息

2013年4月30日 11:00

本来想写一些东西的,但是忽然看到已经有了一篇这样的文章:

正确描述IO类型

与我那个问题的答案有关,大家可以阅读、思考一下。

44 消息

2013年4月30日 11:00

实际工作中,接到很多性能分析的任务,大多数问题的结果一般为以下几种:

1,没有性能问题,或者只需要给出解释。

2,发现热点盘。

3,发现某部件有性能瓶颈。

4,发现数据分布或IO分布不均衡。

不过,也碰到过比较有趣的事情,上面讲的“IO量大,平均响应时间反而小”是一次,还有一次也很有意思。

有一个客户的业务量比以前有了增长,他们发现系统的性能有问题后,采取了一些措施,例如增加CPU,增加内存,增加存储通道数,增加硬盘等等,虽然从主机到存储,都不繁忙,但是IOPS始终无法再增加,无法满足他们的业务增长。

我看了他们的存储性能数据,发现存储负载并不重,平均响应时间也很好,每个卷的Write Pending都很低,没有发现存储有性能问题。

Symmetrix 中的 Write Pending 指主机写入存储Cache中,但是存储尚未从缓存写入磁盘的磁道数,DMX-3/4 或 VMAX上一个磁道为64KB。

我深入分析一些感兴趣的数据时,发现一个现象,有一个卷在白天始终维持着约 400 writes/sec 左右的IO量,平均IO Size也很小,大家想一想,这又是一个神马情况呢?

1.6K 消息

2013年4月30日 18:00

James...半夜三点还在?还是说在出差?

5 Practitioner

 • 

274.2K 消息

2013年4月30日 22:00

hi,james

关于案例二、参考你推荐的文章“正确描述IO类型”,会不会是因为客户业务的线程做了设置啊,线程数少,所以IOPS上不去

另外问个问题:客户购买几块7块闪盘想用来放数据库文件以提升性能,具体应该放数据库的哪部分文件呢,比如:redo log, datafile,还是整个数据库文件都放上去?谢谢!

找不到事件!

Top