EMC CloudArray云集成存储——概述

8 Krypton

EMC CloudArray云集成存储——概述

EMC CloudArray云集成存储——概述

转载请在文首保留原文出处:EMC中文支持论坛https://community.emc.com/go/chinese image001.gif

介绍

      如今的IT组织面临着两大关键数据存储挑战: 数据呈指数级增长,以及对延长数据保存时间的需求不断增长。这两大因素共同作用,对现有的数据中心、可用员工和捉襟见肘的IT预算带来了巨大压力,迫使公司不得不寻求创新的解决方案来支持本地部署基础架构投资和要求,并为前景不明的未来数据增长提供一定的灵活性。

      公共云和私有云存储的可用性日益提高,使得所有规模的组织都能访问各种广泛的弹性存储选项,从而更轻松、更简单地应对存储增长和复杂性。对于大多数公司而言,本地部署的数据中心仍然对性能、安全性或复杂的体系结构要求至关重要,但第二层的归档和备份数据可转换到成本更低但仍可访问的选项,例如公共云或私有云存储。

      本文将介绍如何使用CloudArray云集成存储来实现混合云存储,从而将云存储的较低成本和可扩展性特点与生产系统的高性能、高可用性要求相结合。

更多信息

概述:

      通过运用 CloudArray 技术,组织能够最大限度地增强生产系统的本地部署基础架构,同时将第二层数据分载到公共云和私有云存储中。应用程序通过 SAN (iSCSI) / NAS (NFS/CIFS/SMB/SMB2) 卷与 CloudArray 应用装置进行交互。CloudArray 将数据缓存在本地以便于快速访问,并会自动将所有数据复制到公共云或私有云中。

      与普通云存储集成不同的是,运用此方法将不再需要自定义 API 集成和漫长的学习曲线,从而可以轻松地将现有基础架构连接到云,同时最大限度地减少中断或延迟。除了实现可通过SAN NAS 接口访问对象存储之外,CloudArray 还提供了一系列广泛的功能,旨在解决云存储部署可能遇到的常见问题和挑战,包括安全性、性能、网络带宽、接收、数据减少、数据保护和云到云迁移。

   image002.jpg

特性和功能:

云存储连接

      云部署中常用的基于对象的存储具有多个优点(例如更高的可扩展性和提升的可管理性)。但是,如果要将基于对象的存储集成到组织的现有环境中,就需要与提供商的基于 Web 服务的 API 进行自定义集成。毫无疑问,这种自定义过程会削弱云存储的固有优势并延迟实施,因为它需要由技能熟练的开发人员经过广泛的测试后才能实施,并且会涉及到大量的风险管理

      CloudArray 已经过编程,可直接与超过 20 种公共云和私有云存储提供商的 API 搭配使用。在前端,CloudArray 可将云中基于对象的存储转换为一个或多个本地卷,这些本地卷都可使用 iSCSINFSCIFSSMB SMB2 等常见协议装载到现有服务器上。

      就 iSCSI 访问而言,CloudArray 会将数据块级的原始卷提供给服务器,以便在服务器上装载这些卷并进行格式化。对于基于文件的系统,CloudArray 将提供标准文件共享。管理员可在每个 CloudArray 实例上创建多个不同卷,每个卷可根据要求使用 SAN NAS 协议,且每个卷都可单独进行配置,以满足服务器的性能和可用性要求。

   image004.jpg

      出于性能、安全性和法规原因,组织可能选择将部分数据移动到自己控制的私有云中,或者也可能连接到已基于地理位置或行业特定功能进行审核的公共云存储供应商。管理员可轻松地将特定卷与限制更严格的云提供商(无论是公共云还是私有云)相关联。

      CloudArray 具有独特的功能,能够同时支持来自同一实例的多个云和多个协议。举例来说,这种功能意味着管理员可以同时管理:

·         基于CIFS、连接到低成本且低可用性的公共云的归档卷

·         基于iSCSI、连接到不同的标准服务公共云的备份卷

·         基于NFS、连接到高度安全的私有云的文件共享

智能化动态缓存

      对云技术持怀疑态度的人士通常批判延迟是阻碍云存储采用的关键因素。这种批评意见在一定程度上是合理的,因为单独使用原始云存储(尤其是对于大型文件或生产系统)必定会引发不可接受的延迟。

      为了解决这一问题,CloudArray 利用了本地存储(称为“缓存”)。缓存具有两个作用: 1) 为活动数据提供本地性能,最大限度降低了(在许多情况下可完全消除)云延迟的影响,以及2) 充当读写操作的缓冲区。

      在 CloudArray 物理应用装置中,可用缓存的总容量由硬件配置预先确定,而在虚拟应用装置中,缓存可能是 CloudArray 软件可访问的任何本地存储。实际上,CloudArray 虚拟应用装置可根据要求映射到多个不同存储类型。例如,适用于与高性能或生产系统相关联的缓存的固态驱动器 (SSD),以及适用于对性能和可用性要求较低的归档或其他数据的SATA 驱动器。最终,特定卷的性能取决于以下两个关键因素: 保存在本地缓存中的数据量(以及请求的数据是否位于缓存上)、用于缓存的磁盘类型。

      每个数据卷可与其自己的缓存(“专用缓存”)相关联以提高性能,或者也可以利用公用池。此外,分配给每个卷的缓存量也可以单独进行配置。对于访问频率较低、用于归档的卷或访问量较少的文件共享,缓存大小达到总容量的 1-10% 通常就已足够。这种缓存可能来自卷与卷之间共享的缓存池。用户可使用所有数据,但只有一小部分的数据还保存在本地。利用这种方法,无需扩展本地占用空间就可轻松扩展可用存储的总量。

      对于性能要求较高的卷而言,通常最佳的选择是容量更大的专用缓存。在这种情况下,您可能希望缓存大小最高达到卷大小的 100%,从而确保您在现场和云端分别拥有一份完整拷贝。这可提供显著的可访问性和性能优势。由于所有数据和所有操作都将针对本地缓存而非云卷执行。因此,性能将取决于用于缓存的存储的速度。

      在许多情况下,介于这两个极端之间的缓存大小较为理想。例如,专用于备份的卷中可能包含一个大小刚好足够存放上一个完整备份的缓存。那么,文件恢复或测试过程等日常操作将在本地执行。而在后台,一份备份拷贝将与所有先前备份一样发送到异地。在发生灾难时,可轻松访问数据的异地拷贝。

     无论其大小如何,缓存中将始终包含其关联卷中最近访问过的数据。访问频率较低的数据将单独分层到云端。所有数据(无论是否保存在本地缓存中)将以相同方式提供给用户并供其访问,但缓存数据的执行速度将明显快于需要从云端检索的数据。

   image006.jpg

     随着需求变化,管理员经常会发现,原先配置的缓存大小已不再适当。在这些情况下,只要存在可用磁盘,即可通过 CloudArray 用户界面轻松扩展缓存大小。例如在某个卷中,要将更多的数据移动到缓存中,则您可能希望按比例将您的缓存扩展到新的卷大小。

      另一方面,您可能已经配置了一个非常大容量的缓存,以支持将归档数据快速转移到云端,但一旦所有数据都接收后,您可能希望将其重新恢复为 1% 的“日常水平”。要实现这一目的,您可以减少与缓冲相关联的磁盘数,也可以将卷迁移到较小的缓存中。随着数据不断演变,组织可使用卷迁移功能将“热”卷移动到较大且/或较快的缓存(即 SSD)中,并将冷/归档卷移动到较小且/或较慢的缓存(即 SATA)中。

   image008.jpg

      由于将数据复制到云端的操作是同步发生,因此CloudArray 还会使用缓存来存储“脏数据”(已写入缓存但尚未复制到云中的数据)。本地缓存的容量必须足够大,才能弥补传入数据量和可用于复制到云端的带宽量之间的差距。

      最后,CloudArray 还为管理员提供了一个选项,可使用在应用装置管理中的关键点从云端收集的数据填充空白缓存空间。在发生灾难恢复、公开快照和卷迁移等事件后,管理员可使用云端数据预先填充缓存,从而缩短应用程序读取共享和卷的响应时间。

参考

EMC技术白皮书《EMC CloudArray Product Description Guide

应用于

EMC CloudArray

版本历史
修订号
1 / 1
上次更新时间:
‎07-15-2015 11:37 AM
更新依据: