VSAN Stretched Cluster(延伸群集)站点间带宽计算

Roger_Wu
4 Ruthenium

VSAN Stretched Cluster(延伸群集)站点间带宽计算

VSAN Stretched Cluster(延伸群集)站点间带宽计算

转载请在文首保留原文出处:EMC中文支持论坛https://community.emc.com/go/chinese image001.gif

介绍

      EMC联合VMware推出的新一代超融合系列产品VxRail是一款基于工业标准x86服务器,采用VSAN虚拟化存储技术,能够实现完全自动化配置的超融合产品。我们从VxRail的产品经理处得知,下一版本的VxRail将支持双活(Active-Active)技术,也就是VSAN 6.1Stretched Cluster(延伸群集)功能。

      本文我们将继续介绍如何计算延伸群集中两个数据站点以及见证主机之间的带宽需求。

更多信息

通用建议:

      两个数据站点之间的带宽很大程度上取决于VSAN承担的工作负载、总数据量以及故障场景的处理方式。因此通常的建议参考如下:

   guide.jpg

数据站点间带宽需求:

      在真实的业务场景中,全读或者全写的情况很少。更多的时候,用读写比率来衡量业务I/O特性是常用的办法。以VDI场景的负载举例子。在负载峰值的情况下,读写比率通常是37

      例如:业务需要求IOPS的总量是10万,读写比率为37。由于VSAN延伸群集本地读(Read Locality)的特性,读操作不需要跨站点,因此考虑数据站点之间带宽只考虑跨站点写即可,也即7万写IOPS

      数据站点间带宽计算公式:

      B = Wb * md * mr

      BBandwidth,数据站点之间的带宽。

      WbWrite Bandwidth,数据站点之间的写带宽。

      md: Data Multiplier,数据乘数

      mrResynchronization multiplier,再同步乘数

      其中,数据乘数mdVSAN元数据跨站点写开销等相关的操作组成的(除了数据以外,元数据也需要跨站点写)。VMware建议将md这个数值设置为1.4

      再同步乘数mr指的是数据站点之间同步事件(例如VSAN组件的状态信息)的所需要的总开销。mr这个数值,VMware建议为1.25(也即额外增加25%)

      再同步乘数和数据乘数其实都是跨站点写数据的额外开销。这两个数值使用VSAN推荐值即可。

案例分析

案例1

      VSAN运行一个IOPS1万的全写负载业务。写的block4KB。这需要消耗40MB/s的数据站点间的带宽(4KB*10000),也就是320Mbps

      按照上面的计算公式:B=320Mbps * 1.4 * 1.25 = 560Mbps

      因此,在这个负载情况下,VSAN数据站点之间需要的带宽至少应为560Mbps

案例2

      VSAN运行负载为3万全写IOPS4KB block size,这需要120MB/s960Mbps)跨站点写数据的吞吐量。

      按照公式:B=960Mbps * 1.4 * 1.25 = 1680Mbps ,约等于1.7Gbps

      因此,在这个案例中,数据站点之间的带宽至少应为1.7Gbps

数据站点与见证主机站点间带宽需求

      数据站点并不存放虚拟机的数据,只是用于投票使用,因此数据站点与见证主机站点之间的带宽计算公式与上面的不一样。VSAN是基于策略驱动的分布式存储。数据是以对象的方式存储在VSAN中的,一个虚拟机在VSAN存储中的数据由一个或者多个组件组成,组件有如下类型:

·         虚拟机主目录或命名空间

·         虚拟机Swap对象

·         虚拟机虚拟硬盘(VMDK)

·         快照

      在VSAN中,当一个对象的大小大于255GB的时候,就会被自动划分成多个组件。仲裁站点与数据站点之间的计算公式如下:

      1138 B * NumComp / 5 seconds

      1138 B这个数字来源于当主站点离线,备站点接管所有组件的所有权时所采取的动作。当主站点离线,备站点将成为主站点。见证主机将会向新的主站点发送确认信息,确认主站点的角色已经发生了变更。

      1138 B是当主站点离线以后,见证主机站点需要从元数据信息中获取主站点上所有组件已经失效,并且随后由备站点接管所有权的状态信息更新开销。当主站点离线以后,见证主机站点与数据站点之间的带宽应足以让群集中所有部件的主站点所有权的变更在5秒内完成。

案例分析

案例1

      虚拟机由如下内容组成:

·         三个对象:

o    VM namespace

o    VMKD(小于255GB

o    VM Swap文件

·         Failure to Tolerate (FTT) = 1

·         Stripe Width = 1

      以上配置的虚拟机数量是166个,那么见证主机站点就需要获取到996个组件信息:996=3*2*1*166

      为了方便用1000进行计算:B = 1138 B * 8 * 1000 / 5s = 1820800 Bps = 1.82Mbps

      VMware推荐预留10%的额外带宽用于信息双向传输:1.82 * 1.1 = 2.00Mbps。因此,在这个场景下,数据站点与见证主机站点的带宽应为2Mbps

案例2

      虚拟机由如下内容组成:

·         三个对象:

o    VM namespace

o    VMDK(小于255GB

o    VM Swap文件

·         Failure to Tolerate (FTT) = 1

·         Stripe Width = 2

      如果具有以上配置的虚拟机数量为1500,那么仲裁站点将会维持18000个组件的状态信息:3*2*2*1*1500=18000

      按照计算公式:B=1138 B * 8 * 18000 / 5s = 32.78Mbps

B * 1.1 = 36.05Mbps

      因此在这个场景下,数据站点与见证主机站点之间的带宽需要36.05Mbps

      根据上面的案例,我们可以提炼一个简单的公式用于日常的评估,那就是2Mbps带宽可以支持1000个组件的状态信息。由此得出支持18000个组件的更新,所需要的带宽是:18000/1000*2Mbps=36Mbps

两节点配置下的见证主机站点带宽需求

      在VSAN6.1中,支持2节点的VSAN集群:

   2node.jpg

案例1

      假设一个2节点配置中的虚拟机数量有25台,每个都有1TB的虚拟硬盘大小,FTT=1Stripe Width=1

      上面我们提到过VSAN中一个VMDK组件最大为255G,因此每个VMDK4个组件组成,此外由于FTT=1,在包含副本的情况下,每个VMDK8个组件组成。加上VM namespaceSwap文件(有副本),那么一个虚拟机的组件总数为12=4*2+2*225个虚拟机组件总量为300 (12*25)

      使用通用公式:300/1000*2Mbps=600Kbps。因此在这种场景下,数据站点与见证站点之间的带宽为600Kbps

案例2

      在2节点配置中,每个主机上有100个虚拟机,每个虚拟机有1TBVMDKFTTSW均为1。那么组件的总量为2400

      按照通用公式,2400个组件需要的带宽为2400/1000*2Mbps=4.8Mbps。因此在这个场景中,数据站点与见证站点之间的带宽需要4.8Mbps

      需要注意的是,如果部署了2节点配置那需要给每一个数据站点都预留足够的带宽:

   combine.jpg

      以上面两个案例为例,总的带宽需求是5.4Mbps (600Kbps+4.8Mbps)

参考

VMware技术白皮书

Virtual SAN 6.1 Stretched Cluster Guide

VMware Virtual SAN Stretched Cluster Bandwidth Sizing Guidance

应用于

VMware Virtual SAN

版本历史
修订号
1 / 1
上次更新时间:
‎03-18-2016 03:44 PM
更新依据: