乐趣区

关于存储过程:理论研究漫谈传统IT基础设施09存储03

本文欢送转载,转载请注明出处和作者。

存储类型

如同后面所讲的服务器一样,存储也有很多不同维度的比照。
例如块存储、ISCSI、SAN,平时可能会听到不懂行的人拿这几个来比照,然而这基本不是一个维度下面的概念,根本无法进行比照。
以下咱们从几个维度来对存储类型进行比照。

1- 依照存储的连贯形式

DAS:

特色:磁盘装在服务器外部,直连服务器的串行(SCSI)接口。(相似笔记本通过 USB 直接插入移动硬盘)

长处:部署简略,即插即用,价格便宜;

毛病:只能单台设施应用,无奈共享。

NAS:

特点:磁盘阵列接入 IP 交换机,服务器通过 IP 网络拜访存储;(相似 Windows 笔记本,文件夹右键属性创立共享文件夹,而后其余客户端能够通过 \IP 共享文件夹名称拜访)

长处:磁盘阵列能够通过 IP 网络多台服务器共享拜访,便宜;

毛病:传输数据速率较慢,对大量读写 IO 的反对较差。

SAN:

特点:磁盘阵列接入光纤交换机,服务器配置 HBA 卡接入光纤交换机拜访存储。

长处:三者外面性能最优,IO 读写性能最好,速度最快;

毛病:价格较高,须要额定购买光纤交换机与 HBA 卡进行组网。

2- 依照封装协定分类

SCSI 协定:

对应 DAS 存储,硬盘通过 IDE 或 SATA 接口线连贯服务器主板,数据通过 SCSI 协定进行封装,而后传输。

ISCSI 协定(对应 IPSAN 网络):

对应 NAS 或是应用 IP 交换机的块存储,磁盘阵列设施有控制器,控制器上有 NAS 接口板(相当于以太网卡),通过以太网线与一般 IP 交换机互联,数据先通过 SCSI 协定封装,外层再封装 IP 协定,再通过 IP 网络传输。

FC 协定(对应 SAN 网络):

对应 SAN 网络的存储(个别为块存储),磁盘阵列设施有控制器,控制器有光纤接口,通过光纤与光纤交换机互联,服务器须要特地配置 HBA 卡,连贯光纤交换机拜访磁盘阵列,数据通过 FC 协定进行封装。

FCOE 协定:

对应 SAN 网络存储,但 IP 交换机采纳具备 FCoE 性能的交换机,数据通过 FC 协定进行封装,外层再封装 IP 协定,再通过 IP 网络传输。

3- 依照存储网络分类

4- 按产品类型分类

1、集中式存储

集中式存储指采纳单台 / 单套专用存储硬件,对数据进行集中寄存,而后通过接入 FC/IP 网络的形式,共享给多台服务器同时拜访的存储。此类存储的冗余通常通过该专用硬件外面各局部部件进行冗余配置来解决(如通常配置至多 2 个控制器,磁盘须要配置热备盘,磁盘组要做 Raid,风扇、电源也冗余配置等)。(如 IBM DS8000、EMC VMAX 零碎列 等)

长处是专用硬件,各局部部件冗余,性能强劲,能够通过减少扩大柜与磁盘扩容容量与性能。(Scale Up)

毛病是专用硬件价格昂贵,并且通常品牌绑定,不同品牌之间的设施无奈搭配扩容容量应用。甚至同品牌的不同系列存储产品,都不会向下兼容。而就算再高端的系列产品,受限于控制器的性能,上面能够带的磁盘总数与扩大柜数,都是有限度的。因而一旦应用容量 / 性能超过最大值,就要弄一套新的存储,须要业务那边思考如何将数据拆分到 2 套独立的存储中去。

集中式存储次要分以下两类:

01、传统块存储:

根本对应 SAN、IPSAN、DAS,指裸磁盘映射给服务器的操作系统,由操作系统对裸磁盘进行格式化(即装置文件系统)后能力应用。

长处是读写 IO 性能高,局部数据库必须采纳这种形式的存储。毛病是不适宜存储数据的共享,如 Linux 服务器的磁盘文件系统是 EXT4,而 Windows 的服务器文件系统为 NTFS,两者的磁盘数据无奈共享。

02、传统文件存储:

根本对应 NAS 存储,用一般服务器也能作为 NAS 应用,有专门的文件系统(NFS、CIFS),其余服务器只有 IP 可达,即能够应用其作为文件存储,拜访的时候能看见一级级的文件目录,无需格式化即可以上传或下载文件。

长处是能够共享数据(Linux/Win 的服务器都能拜访),毛病是只适宜寄存文件(数据库不能用这种)以及 IO 性能差。

2、分布式存储

能够了解为服务器 +DAS+ 软件:业界根本采纳服务器装大硬盘,而后分布式部署,再通过几台治理服务器装置对象存储软件的形式实现。治理服务器有所有数据的元数据(即所有数据的属性,如大小,日期等),用户拜访时先向治理服务器查问数据所在,而后间接拜访理论存储数据的分布式对象存储服务器拿数据。

长处是分布式的服务器同时并行对外提供服务,晋升了 IO 性能,实践上能够有限横向扩大。(Scale Out)

毛病是依赖于软件自身,操作、保护都有门槛,须要专门的技术人员去治理与运维。

分布式存储别离有分布式块存储、分布式文件存储、分布式对象存储。

对象存储:

对象存储适宜寄存一次上传,屡次读取,从不批改的数据。(例如当初挪动互联网,大家抖音发的视频,微博、朋友圈发的文字、图片、视频,都有此属性)对象一旦上传是不能批改的。

对象存储与传统的存储不太一样,寄存的货色叫对象。对象除了须要存储的数据自身,还包含一部分叫元数据的内容(用来形容数据自身属性的数据,例如最初批改工夫,对象大小等)。对象寄存在一个叫 Bucket 的存储空间下,没有文件系统、目录等概念,存储空间在对象存储内有惟一的全局 ID,存储对象数据是通过 KEY:VALUE 的键值对的形式进行存储的。用户能够间接通过“存储空间对象 KEY”的形式,通过网络读取与调用对象的 VALUE。

与块存储与文件存储相比:

1、文件存储是树状索引式的,拜访越深刻的目录,耗费的资源越大。对象存储应用 key:value 进行存储,读取开销很低。

2、块存储不不便进行数据共享,而文件存储能够将文件上传之后,其余用户有拜访权限的状况下能够间接通过 http/RestAPI 等形式调用对象,从而达到数据共享。

3、NOSQL 存储

nosql 的全称是 not-only-sql,以往罕用的数据库都是关系型数据库,将业务逻辑通过抽象化的形式,具象成一堆具备关联关系的二维表,然而随着挪动互联网的高速倒退传统的关系型数据库在应酬超大规模超大流量以及高并发的时候力不从心,特地是在 SNS 之类的利用,很多都是图片、视频等非结构化的数据。

NOSQL 具备 Key-Value 存储、列式存储、对象存储等多种形式,在特定的利用场景可能提供更快的查问能力。
更多精彩内容,能够关注我的 微信公众号 Waiting 的运维日常

本篇文章由一文多发平台 ArtiPub 主动公布

退出移动版