关于深度学习:热温冷冰数据存储需要全生命周期管理

42次阅读

共计 2967 个字符,预计需要花费 8 分钟才能阅读完成。

随着云计算、大数据等新兴利用宽泛遍及,业务数据出现爆炸式增长,海量数据的高效拜访、经济存储和智能治理变得越来越重要。

从数据生命周期来看,在数据刚生成并应用时,属于在线数据,在线数据拜访的频率最高,数据的价值也最高,对数据拜访的性能、数据的拜访的连续性、数据逻辑谬误后的恢复性有很高的要求,但随着工夫的推移,在线热数据会逐渐变成温数据,甚至冷数据和冰数据;据统计,超过 30 天的数据的使用率不到 10%,但这些数据依然很重要,如何解决和正当存储这部分数据,对 IT 零碎的运维部门来讲,是一个须要解决的重要问题。

浪潮存储基于对数据需要特点的钻研,发现不同期间的数据存在不同的需要,对于存储性能、老本的需要差别较大,基于这些特点提出了热、温、冷、冰四级分层数据生命周期管理策略,依据数据的拜访频率不同,提供相应的计划和产品,通过数据分级集中管理,实现存储性能、容量和老本之间的均衡,晋升零碎的整体存储性能的同时,缩小设施投入老本。

热数据高可用,保障业务永续

MES(制造执行系统)、HIS(医院信息系统)、ERP(企业资源打算)等结构化数据为主的要害业务,对存储性能、对业务连续性有十分高的要求,浪潮提供基于集中式存储平台的免网关存储双活计划,在双活模式下,两个数据中心具备等同的业务解决能力并通过高速链路实时同步数据,采纳浪潮独有的 WAN 网络减速技术,通过先进的算法实现数据流压缩、固定块切割和多数据流并发,将近程传输的性能晋升高达 10 倍、延时升高为原来的十分之一,仅占用大量的网络带宽就能够实现海量数据的近程复制,大幅升高企业对容灾网络带宽的依赖,节约老本。若其中一个数据中心呈现故障,业务会立刻主动切换到另一数据中心,放弃业务间断运行,并且计划不须要独自网关,在升高了提早的同时,也缩小了网关带来的额定故障危险。

在此基础上,浪潮存储能够降级至容灾更全面的两地三核心计划,即生产数据中心、同城灾备核心、异地灾备核心。其中异地灾备核心提供数据备份,当同城中心因自然灾害等起因而产生故障时,异地灾备核心能够用备份数据进行业务的复原。两地三核心的设计架构,可在同城双核心遇自然灾害或人为毁坏时,应用异地灾备核心及时复原并提供无效的信息服务,从而保障业务和数据的连续性。

在容灾计划中,浪潮集中式存储平台可能提供满足企业要害的业务需要的可靠性和性能。在可靠性方面,浪潮存储从器部件到存储操作系统再到算法进行了全面的增强。在性能方面,通过一直打磨以 iTurbo 为外围的减速引擎,优化资源调度算法,充分利用更多的 CPU 外围和线程承载更多的数据存储过程。通过搭载 iTurbo 智能引擎,浪潮集中式存储在 SPC- 1 性能测试中发明了 2300 万 IOPS 的世界纪录。

浪潮成熟的双活、两地三核心技术计划曾经在金融、医疗等要害行业有大量的成功实践,无论是在理论产生的劫难还是灾备演练,RPO 和 RTO 均接近于零,无效保障了用户要害业务的连续性。

温数据备份,确保数据安全

容灾计划通过数据多地寄存,物理上保障了在线热数据业务间断,但遇到逻辑问题仍可能面临危险。比方以后端业务新建一个文档,批改一条数据,删除一个图片时,存储会把最新的状态保留下来,数据的历史状态始终会被最新的状态笼罩。无论是歹意入侵、误操作,还是失常操作,存储并不辨认下层软件的用意。如果是异样操作,则须要业余的备份零碎将数据恢复到操作之前的状态。

浪潮备份解决方案部署备份一体机 DP2000G6,繁多设施可提供传统备份计划中备份软件、备份服务器、备份存储三者的性能,满足企业 D2D 及 D2D2T 备份需要,简化了用备份零碎的建设和保护。浪潮备份计划通过合成多种备份技术,利用上一个全备份以及其后的增量备份生成一个新的备份,兼顾全备和增备的劣势,有效应对须要备份大量文件的利用场景;并通过重删和压缩技术,进步了备份速率,升高了企业扩容老本。

温数据备份计划能够无效抵挡因人为误操作、被勒索病毒攻打、以及自然灾害等不可抗拒力而导致的业务中断和数据失落所带来的危险,帮忙用户实现业务永远在线,数据永不失落。

冷数据归档,低成本存储有保障

随着互联网、人工智能、大数据等新技术的疾速利用,数据采集精确度一直晋升,起源一直增多,传输效率也在疾速晋升,数据规模爆发式增长,其中 80% 以上多为图片、视频等非结构化数据。这些非构造数据在应用一段时间后,会积淀为应用频率不高的冷数据,然而冷数据并非失去价值,大数据、人工智能等新兴业务对海量冷数据进行检索和开掘的需要仍然存在而且日益迫切。面对体量微小但拜访性能要求不高的冷数据,传统存储无奈满足海量冷数据的低成本存储需要。

基于数据存储老本、容量、性能等方面的衡量考量,浪潮存储采纳分布式存储对海量冷数据进行治理,满足大数据等新兴业务对局部冷数据进行近线或在线拜访的偶发存取性能要求。

浪潮分布式存储 AS13000 系列可同时提供文件、块、对象、大数据四种存储服务,实现一套存储撑持一个数据中心业务,极大地提高数据共享的效率,同时所有设施对立治理,缩小设施保护和治理老本,升高 TCO。此外,随着业务增长,浪潮分布式存储不仅能够通过扩大节点减少容量及性能资源,还能在所需的存储类型产生了巨大变化状况下,能够将原有块存储的资源进行开释,配置为文件存储空间,从而防止反复投资,帮忙企业敏捷地应答海量数据业务简单的存储需要。同时为了保障数据的平安,浪潮分布式存储还基于回收站性能无效避免数据误删;并采纳数据冗余策略,反对业界最高的 8 份正本、4TB/ H 疾速重构进一步晋升系统可靠性。

冰数据离线,经济节能长期保留

除了企业本身业务的特点对数据有着长期保留需要之外,在特定的行业,对数据还有明确的监管要求,如医疗行业住院病历数据须要保留 30 年以上;测绘地理信息业务档案保存期限最长为永恒;教育行业的学生信息,问题,档案要求永恒保留。针对于此类数据拜访频率非常低,但须要保障平安的数据,浪潮存储采纳了模块化的磁带库,在保障数据安全的状况下,提供长久经济的解决方案。

首先,从经济节能的角度,磁带采纳纳米级磁性颗粒,存储密度更高,并且一个磁带驱动器能够对应大量的磁带,当扩容时,只需思考存储介质的老本,等同容量下磁带存储的老本仅为磁盘的 1 /6;磁带离线存储记录下数据后,被寄存在主动磁带库的卡槽中,不必定期通电保护,节俭大量能耗。

其次,在安全可靠层面,磁带配有内置和动静加密,以及介质本身的性质带来额定的安全性,如离线状态断绝了黑客和网络攻击,无法访问或批改数据;依据相干测试表明磁带出错率相当于硬盘万分之一,能保障数据保留期限长达 30-50 年。

浪潮冰数据离线解决方案反对最新的 LTO9 磁带,单零碎最高可提供 400 多 PB 数据空间,满足金融、医疗、档案、石油勘探等行业的海量重要数据离线长期存储需要。

数据作为企业重要的数字资产,随着企业数字化转型一直减速,数据安全要求越来越高,数据价值开掘越来越深,数据全生命周期的管理模式已成为企业在智慧时代下全新的需要。为此,浪潮提出“存储即平台”策略,以面向要害利用的集中式存储平台、面向智慧利用的分布式存储平台、保障数据安全的备份存储平台、长周期保留数据的归档存储平台四大平台,针对数据不同周期的性能、容量、老本等需要特点,提供数据全生命周期存储解决方案,助力企业提速数字化转型。

正文完
 0