关于云计算:深入浅出文件系统新形态

3次阅读

共计 2825 个字符,预计需要花费 8 分钟才能阅读完成。

文件系统历史悠久,在各种场景中都失去了宽泛的利用,从独立的一块硬盘 DAS、到集中的 NAS、再到目前宽泛应用的分布式文件存储、云存储等。从倒退历程来看,次要是从数据规模角度解决了业务对文件系统的需要,但并未给理论应用场景带来实质变动,仍然须要保护大量的硬件资源;在业务倒退过程中,仍然存在各自为政的“烟囱”式存储;数据共享须要依赖拷贝的形式,从而导致数据反复。究其根源是短少无效正当的数据分享机制,无论是通过本地还是近程形式。

私有云的存储容量有限,按需购买的形式为用户带来一丝曙光,不论是将全副数据转移到云上,或是局部数据的 Hybrid 形式,都能够加重 IT 人员进行硬件洽购、保护以及前期服务降级等方面的压力。但因为流量费用居高不下,也限度了企业将其作为一级存储利用。

企业倒退也触发对数据拜访、平安需要的变迁。随着数据总量持续增长,数据近程拜访能力成为企业降本增效的伎俩,而对数据安全的需要,也随着泛滥勒索软件的呈现日益加强。

这些变动使得 IT 治理进入了两难境界:一方面,私有化的本地存储难以提供更丰盛的拜访形式,同时保证数据安全可靠、可拜访性的需要对基础架构的挑战以及前期保护所产生的费用也随之减少;另一方面,私有云存储数据流量费用远超预期,并且私有云存储也短少实用于企业本身主存储所强调的去重、本地性能等个性。私有云设施的不欠缺,以及企业对数据 Off-premises 的述求,催生了更加“全面”的存储及拜访需要,即 Global File System。

本文通过分享几款国外比拟有特点的 Global File System 产品,通俗易懂地分析其解决方案的偏重及性能的异同。心愿能给大家带来文件系统开发的一些设计思路与办法,也欢送大家文章末留言探讨。

Global File System 简介

Global File System(GFS) 通常意义上指利用云存储作为介质,同时提供对立命名空间以及近程缓存拜访减速能力的文件存储解决方案,各自的实现不同,具体的性能会存在差别,但以下几点凸显了 GFS 的特点:

  1. 特供本地缓存能力
  2. 利用云存储作为惟一的可信存储源,或者 Master Copy
  3. 整套零碎,无论是本地设施,还是云上存储,对立通过权限控制系统拜访惟一命名空间
  4. 提供 NFS、SMB 的拜访能力
  5. 通过 Global file synchronization 来提供一致性保障
  6. 提供数据保护能力,例如 Versioning 或者 DR

将云存储作为 GFS 的外围,大幅度降低硬件老本以及运维复杂度;同时利用本地缓存能力,在提供足够性能的同时,缩小对云上资源间接拜访的流量费用;利用附加的去重等能力,缩小存储空间占用。

同时,基于云存储的可拜访性,GFS 也能够打消近程拜访壁垒,提供疾速、可控的拜访能力,而无需关怀数据、以及用户的地理位置,通过 Global file synchronization,保障不同客户之间数据一致性以及无效合作。

具备典型特点的 Global File System 产品

HammerSpace

HammerSpace 是一个软件定义的数据编排以及存储解决方案,通过高性能的并行零碎拜访提供对立的文件拜访接口,而无需关怀跨供应商、跨地区、跨云的存储系统。无论数据在哪里,用户以及利用均可共享雷同数据。

它提出了一个典型的创新性理念,那就是将“文件系统”这一概念上移,成为聚合层,而不是存储厂商的内嵌产品。

在企业外部,存在多种独立共享的存储,通过 HammerSpace 聚合成 Global File System 的同时,保留原有权限,用户仍然只能看到他们所能拜访的文件。同时 HammerSpace 聚合时,仅仅对存储的元数据进行扫描整合,不会大量拷贝、迁徙现有数据。

在治理大量异构文件系统后,进一步开掘数据特点对业务管理尤为重要。比方,哪些数据是某个业务常常用到的。HammerSpace 通过丰盛的文件元数据附加属性 Tag 来提供这种能力,依据 Tag 定义数据挪动的策略、概览一个部门、一个工作所设计的所有文件等等。

特点

  • 对立的元数据管理,但并不迁徙数据
  • 自定义标签
  • 高性能的拜访形式

LucidLink

从 LucidLink 的视角来看,与私有云的网络连接越来越快,Latency 的影响因素逐渐淡化,云“间隔”业务越来越近。同时云存储无论从可靠性,还是可用性角度,都变得越来越成熟,所以即便是 Mission-Critical 的利用,也能够利用云存储联合肯定的技术计划满足要求。

LucidLink 通过将云存储无缝整合老本地存储的一个层级,做到数据在各个层级之间平安、灵便的挪动、复制、分享等。

它利用 Log-Structured 的构造将数据搁置在对象存储上,同时通过独立的元数据管理提供一个残缺的文件系统性能,可反对最终一致性以及强一致性的切换,所以当存在文件锁语义时,会主动造成强一致性的完整性要求。

特点

  • 反对快照
  • 反对 BYOK 加密
  • 反对去重

Panzura

通常 NAS 存储在靠近业务端时,性能体现优异;当须要近程拜访时,速度问题会导致其无奈应用。企业为了解决这类问题,在各地别离搭建独立的存储系统来满足业务需要。由此产生的后果就是,进行跨零碎数据分享时,要通过人工或者定时拷贝的形式,且在数据全生命周期内存在数据的多个正本,为数据管理带来极大困惑。

Panzura 通过云上对象存储,提供全局一致性以及多个站点间的本地性能,并且充分利用压缩和去重的能力,大幅度缩小非结构化数据的存储容量。

特点

  • 快照增量疾速同步
  • Pinned 缓存数据
  • 全局去重的能力

Komprise

专一于数据管理,旨在治理多个数据孤岛,并通过对数据扫描进行后续的剖析和治理,将 Right Data、Right Place、Right time 作为其核心理念。数据呈爆炸式增长,须要咱们从新扫视数据的治理。存储资源耗尽,数据管理耗时更长,费用越来越高,这些问题随着企业采纳更多混合云、多云计划将更加凸显。

Komprise 在不干涉数据业务门路的状况下,通过提供给管理者疾速的全局概览,使数据轻松地在正确的工夫呈现在正确的地点,并提供给数据使用者原生拜访能力,防止厂商锁定问题。

特点

  • 数据通明挪动 TMT,对热数据拜访门路无影响
  • 数据流程自定义,能够灵便组装 Pipeline

总结

Global File System 将整个企业组织的文件、目录作为一个整体出现给用户,而无需关注它们的具体位置,或者所提供的厂商。无关 Global File System 的产品还有很多,例如 CTERA、Egnyte、Nasuni、NetAPP 等。上述的每一个产品相互之间既有重叠局部,也有各自独特的特点和理念。例如 LucidLink,Panzura 次要为近程用户解决文件同步与分享的问题,进而能够替换线下以及云内的存储产品;Komprise 重在解决文件治理以及存储的问题;而 Hammperspace 则针对于“Local access to Global Data”的愿景从新定义了文件系统以及服务的概念,并不仅仅在垂直畛域解决某一个问题。

正文完
 0