关于云存储:8-种常见的云存储安全风险及防护建议

云存储是一个以数据存储和治理为外围的云利用零碎,德迅云平安给企业组织提供了一种全新的数据信息存储模式。只管目前云存储的安全性问题曾经有了很大改善,但因为云计算技术本身的特点,决定了它在安全性方面依然有很大的挑战,一旦云存储的平安防线被攻破,其中存储的数据都将会被泄露。 德迅云平安对 8 种常见的云数据存储危险进行了整顿和剖析,并提供了无效的缓解策略。通过理解这些危险,企业能够更好地爱护云上数据的存储平安。 01 云平台配置谬误 云配置谬误被认为是云数据存储中最常见的平安危险之一。因为权限调配不正确、默认配置未更改以及平安设置治理不当等起因,配置谬误可能会导致云上敏感数据或服务的裸露,这种状况会对所有存储在谬误配置环境中的数据产生安全性影响。 防护倡议 ●强制执行最小特权准则,将拜访权限放弃在资源所需的最低限度,定期查看和更改用户拜访权限。 ●应用 IAM 工具,确保正确配置和治理用户的身份验证和受权。 ●查看 IaC,要求团队成员查看根底构造即代码(IaC)文件。 ●确定 HTTPS 的优先级,要求应用 HTTPS 协定,并阻止不须要的端口。 ●将 API 密钥和明码保留在一个集中、平安的管理系统中,将默认数据存储设置设为公有。 02 数据泄露 数据泄露通常源于云基础设施或应用程序中存在的破绽,黑客会利用这些破绽发动攻打。他们可能会利用软件破绽、进行网络钓鱼或利用凭据泄露等伎俩来获取数据。 防护倡议 ●对传输中的数据和静态数据进行加密,确保根本安全性。 ●应用基于 API 的 CASB 计划,避免云拜访的违规行为和数据泄露。 ●执行定期审核、监控流动和设置警报来加强云数据存储的安全性。 ●采纳微分段和 JEA,微分段能够限度不同区域之间的拜访,JEA 提供精密的权限治理办法,能够增强对用户的管制。 ●定期备份云上的数据和资源,确保数据的可恢复性。 03 不平安的 API 接口 攻击者利用云利用零碎的 API 破绽能够未经受权地拜访和操纵数据,并在云中植入恶意代码。随着 API 在古代编程中的广泛应用,爱护 API 对于缓解常见的攻打类型变得至关重要,例如代码注入、访问控制问题和利用过期组件的破绽。 防护倡议 ●采纳全面的 API 平安性能,例如定期输出数据检查和适当的受权协定。 ●部署 Web 利用防火墙(WAF),依据 IP 地址或 HTTP 标头筛选申请,辨认代码注入尝试,并定义响应配额。 ●限度给定时间段内来自单个用户或 IP 地址的 API 查问次数。 ●为 API 建设残缺的监控和日志记录,以跟踪和评估操作。 04 DDoS 攻打 ...

February 26, 2024 · 1 min · jiezi

关于云存储:免费下载云存储应用白皮书详解创新背后的技术实践

数据是最贵重的资源之一,而存储是数据的载体。人类文明的发展史,其实就是建设在存储技术的演进之上的。在远古期间,晚期人类通过结绳记事、龟甲兽骨,点燃了人类文明的火种。起初,随着工艺技术的提高,逐步有了竹简木牍、纸张缣帛,人们能够更好地记录信息,才有了“驿寄梅花,鱼传尺素”。进入21世纪,云存储技术衰亡,并成为应答数据洪流的利器。 云存储作为基于云计算相干技术延长和倒退而来的全新的产品状态,是古代IT设施中重要的一环。以阿里云存储为例,在实现了以弹性扩大、灵便高效、降低成本为外围的存储根底服务当前,曾经实现了撑持团体100%业务上云的指标,同时还帮忙越来越多的客户实现数据管理的数字化和智能化。 残缺内容请点击下方链接查看: https://developer.aliyun.com/article/1243548?utm_content=g_10... 版权申明:本文内容由阿里云实名注册用户自发奉献,版权归原作者所有,阿里云开发者社区不领有其著作权,亦不承当相应法律责任。具体规定请查看《阿里云开发者社区用户服务协定》和《阿里云开发者社区知识产权爱护指引》。如果您发现本社区中有涉嫌剽窃的内容,填写侵权投诉表单进行举报,一经查实,本社区将立即删除涉嫌侵权内容。

June 19, 2023 · 1 min · jiezi

关于云存储:腾讯云存储2022年终回顾感谢您的一路相伴

January 10, 2023 · 0 min · jiezi

关于云存储:云存储生态构建的技术基因和最佳实践

当云计算、大数据、物联网、人工智能等新技术络绎不绝,咱们都在时代的洪流中亲历这样的变动——数字科技深刻浸透工作生存,从生产娱乐到生存服务,再到产业变革。 一 智能化时代,企业 IT 趋势的四大转变不难发现,以上云为次要特色的数字时代,最典型的特色是数据的高速增长。据相干机构预计,到 2026 年,寰球数据量将高达 216ZB,其中 90% 为非结构化数据。为了应答云时代数据洪流,自若地将数据“存-管-用”,企业 IT 建设趋势也在发生变化。 第一,IT 建设的布局须要“俯视星空,好高鹜远”。不光要思考高性价比的投入和反对现有业务信息化,更要思考如何麻利、疾速地响应翻新业务的验证和迭代,以应答疾速变动的市场。第二,数据化会带来组织效率的晋升和更细粒度的分工,从而导致利用的数量增长。另外,越来越多的企业应用的云原生化和微服务化也带来利用数量的增长。因而在企业IT架构建设之初,利用数据的长久化存储和利用的可观测性就应打算实现。第三,业务利用数据的互联互通曾经不再是方向,而是在企业 IT 整体架构设计中之初就必须思考的事件。对立设计的数据底座让这所有唾手可得。第四,智能物联网高速倒退催生了新的行业场景,近客户端疾速响应、简略数据处理+云端海量存储,准实时或离线计算剖析的场景越来越多,须要有云/边/端的对立数据底座部署能力。二 从“量”到“质”的技术能力转变大数据容量的“质变”须要数据处理技术的“量变”,对于企业而言,云提供了灵便的弹性伸缩、弹性存储容量、安全可靠、高可用性和稳固的性能等能力。大数据时代下,云存储失去了飞速发展,其成熟过程始终贯通着“利用的需要”与“技术倒退的推动”这两条主线。 针对一直演进的需要变动,阿里云已在存储畛域实现全面布局,包含块存储、文件存储、表格存储和对象存储在内的云上存储家族,混合云 CPFS 存储、混合云阵列、云存储网关、云定义存储的混合云存储服务,以及高性能分布式存储和数据库存储等典型场景存储计划。 作为阿里云飞天零碎中极其重要的一环,阿里云存储领有对立设计的数据底座,不仅提供了丰盛残缺的公共云和混合云存储产品矩阵,还通过客户数据中心和边缘局点到云上的整体存储解决方案,突破了数据存储和流通的边界,帮忙企业开掘数字化经济时代的新石油,推动 IT 麻利化和易用化的浪潮。 三 存储生态构建的最佳实际基础设施为云暴发发明了先决条件,在稳固、欠缺、成熟的基础设施之上,海量利用刚才井喷式爆发。Cloud2.0 时代,数字化转型进入深水区,须要联结所有的搭档力量,奋楫笃行,独特买通从数字技术到具体解决业务问题的各种关节。 阿里云认为,将数字技术落实到企业和组织中,造成真正可能解决业务问题、翻新业务场景和商业模式的解决方案,是一个十分粗疏而又繁琐的工作,必须依附宽广的合作伙伴才可能实现。阿里云的 IaaS 始终放弃着技术当先,而存储作为 IaaS 的外围组成部分、IT 设施中最重要的一环,心愿以被集成的形式让搭档利用好这些原子能力,为客户构建丰盛的数据存储解决方案。目前,已有不少搭档利用阿里云存储胜利构建了数据平台。 ■ 飞轮数据基于阿里云 OSS 构建云原生数仓 云原生是数仓基础架构的一个根本的演进方向。近几年云原生数仓守业赛道很火,也被资本市场看好和重点布局。云原生实时数仓厂商 SelectDB(北京飞轮数据科技有限公司)抉择了用对象存储 OSS 构建其外围产品 SelectDB 的存储底座,完满解决各类数据汇聚,流动,提取,治理简单,剖析效率低下的数仓构建中的典型问题,帮忙 SelectDB 的客户实现跨部门的数据共享,疾速满足企业数据分析和治理的各类需要。 在联邦查问、即席检索等传统数仓容易呈现性能瓶颈的场景,一条命令,即可实现极致的数据分析能力,晋升用户应用体验。对象存储 OSS 同 Hadoop 生态的完满适配,帮忙“货拉拉”、“同程数科”、“蜀海供应链”等出名 SelectDB 用户无缝对接 Hadoop 生态,还能同阿里云上函数计算,EMR 等大数据分析产品原生配合应用,让商业决策更加不便和及时。近期,在 ClickHouse 发动的剖析型数据库性能测试排行榜 ClickBench 中,云原生数仓 SelectDB 强势登顶。 值得一提的是,对象存储 OSS 提供单命名空间 50 亿文件的反对和 10 万 QPS 的元数据操作能力,再配合应用阿里云文件存储 CPFS 专门针对小文件提供的百 TB 容量 280 万 IOPS 的能力,可升高 95% 的计算等待时间,大幅晋升训练效率。全面服务化的状态,极致的性价比优化,无论是用户筹备降级目前的数仓平台还是筹备构建本人的数仓平台,都是不二首选。 ...

January 9, 2023 · 1 min · jiezi

关于云存储:JuiceFS-元数据引擎选型指南

文件系统是咱们常见的存储模式,外部次要由数据和元数据两局部组成。其中数据是文件的具体内容,通常会间接展示给用户;而元数据是形容数据的数据,用来记录文件属性、目录构造、数据存储地位等。一般来说,元数据有十分显明的特点,即占用空间较小,但拜访十分频繁。 当今的分布式文件系统中,有的(如 S3FS)会将元数据和数据对立治理,以简化零碎设计,不过这样的弊病是某些元数据操作会让用户感触到显著的卡顿,如 ls 大目录,重命名大文件等。更多的文件系统会抉择将这两者离开治理,并依据元数据的特点进行针对性优化。JuiceFS 采纳的就是这种设计,其架构图如下: 其中,元数据引擎须要是可能反对事务操作的数据库,而数据引擎个别是用对象存储。目前为止,JuiceFS 曾经反对 10 种以上元数据引擎和 30 种以上数据引擎。 用户在应用 JuiceFS 时能够自在地抉择成熟组件来充当这两个引擎,以应答丰盛多变的企业环境和数据存储需要。然而对于新用户来说,当面对更多抉择时,也带来了一个问题:在我的场景中到底抉择哪一款数据库作为元数据引擎比拟适合?这篇文章将从产品设计角度,为大家介绍 JuiceFS 可应用的元数据引擎类型,以及他们的优劣势。 01-JuiceFS 元数据引擎类型JuiceFS 当初反对的元数据引擎总共有有三大类。 第一个是 Redis。Redis 是 JuiceFS 开源后最早反对的元数据引擎。首先 Redis 速度够快,这是元数据引擎须要具备的重要能力之一;其次,Redis 受众面广,大部分用户对 Redis 都有实践经验。JuiceFS 对兼容 Redis 协定的数据库也都实现了反对,比方 KeyDB、Amazon MemoryDB 等。 然而,Redis 的可靠性和扩展性容易受限,在一些数据安全性要求较高或规模较大的场景中体现乏善可陈,因而咱们又开发反对了另外两类引擎。 第二个是 SQL 类。如 MySQL、MariaDB、PostgreSQL 等,它们的特点是风行度较高,且通常具备不错的可靠性与扩展性。另外,还反对了嵌入式数据库 SQLite。 最初一个是 TKV(Transactional Key-Value Database)类。它们的原生接口比较简单,因而在 JuiceFS 中的定制性更好,相较于 SQL 类个别也能有更高的性能。目前这一类反对的有 TiKV、etcd 和嵌入式的 BadgerDB 等,对 FoundationDB 的反对也在紧锣密鼓地开发中。 以上是依据 JuiceFS 在对接数据库时的协定接口进行的分类。每个大类外面有各种不同的数据库,每种数据库又有其本身的特点,以下依据这些特点对用户罕用的几个选项进行比拟。 元数据引擎比拟 RedisMySQL/PostgreSQLTiKVetcdSQLite/BadgerDB性能高低中低中扩展性低中高低低可靠性低高高高中可用性中高高高低风行度高高中高中如上文中提到的,Redis 的最大劣势是性能高,因为它是全内存的数据库。其余几方面它就体现平平。 从扩展性上说,通常单机 Redis 能够反对 1 亿文件左右,超过 1 亿时,Redis 单过程的内存使用量会比拟大,治理性能上也会有所降落。开源版 Redis 反对以集群模式来扩大其可治理的数据总量,但因为集群模式下 Redis 并不反对分布式事务,因而作为 JuiceFS 元数据引擎时,每个 JuiceFS volume 能用的 Redis 过程还是只有一个,单 volume 的扩展性相较于单机 Redis 并没有太大晋升。 ...

October 10, 2022 · 2 min · jiezi

关于云存储:学一点Ceph知识初识Ceph

Ceph是什么?Ceph是一个开源的分布式存储系统,可大规模扩大、高性能、无单点故障,在一般的服务器上能够反对到PB级容量,商用机器上反对的容量能够达到EB级别。 Ceph的竞争力市面上提供云存储的分布式系统如阿里云的OSS(底层存储框架为JindoFS),亚马逊的S3,Hadoop生态下的HDFS,OpenStack内的Swift,都是十分优良、风行的存储解决方案,Ceph作为同类产品,依然不逊色: 更低的TCO(总体领有老本),Ceph能够部署在一般的商用服务器上,比专有存储系统的估算更低。Ceph的每一个组件都是牢靠的并反对高可用。分布式存储,客户端动静地计算数据存储地位,不适度依赖元数据服务器。Ceph集群外部发现的节点宕机,磁盘损坏等故障,Ceph集群可能利用正本数据进行自我修复,保障集群数据可用。Ceph退出Linux内核主线。Ceph可能同时提供对象存储、块存储、文件存储。Ceph的对立存储计划Ceph的对立存储计划同时满足对象存储、块存储和文件存储,并且Ceph曾经退出Linux内核主线,意味着Ceph存储更加贴近OS层,对立存储计划架构图如下所示: 从上图能够晓得,Ceph仅从软件层面就提供了对象、块和文件存储。对象存储要比块或者文件更加适应当初的混合的非结构化数据。 传统的文件存储系统中,文件是通过文件目录进行寻址的,宏大文件目录或深层次目录构造,均会影响文件搜寻的效率,Ceph底层并不存在块和文件的治理,而是治理对象并且在对象之上反对基于块和文件的存储,对象的寻址通过惟一的标识符,并存储在扁平的寻址空间中,客户端应用CRUSH算法失去一个存储对象的存储地位,从根本上解决海量文件搜寻慢的问题。 Ceph整体架构Ceph集群次要由Monitor、OSD两个守护过程组成,每个守护过程互相独立,独特构建集群的残缺性能个性,架构示意图如下: 简要论述每个ceph组件的性能: RBD,也叫Ceph块设施,原先叫做RADOS块设施,对外提供块存储,它能够像祼磁盘一样被映射、格式化、挂载到操作系统上。RADOS GW,Ceph对象网关,简称为RGW,目前对Amazon S3和OpenStack对象存储API提供了兼容的Restful API接口,另外RGW还反对多租户和OpenStack的Keystone身份验证服务。Ceph FS,Cehp文件系统,提供了一个任意大小且兼容POSIX的分布式文件系统,它依赖Ceph MDS(元数据)来跟踪文件层次结构。librados库是RBD、RGW的根底,能够为Ceph FS提供POSIX接口,librados目前反对PHP、Ruby、Java、Python、C和C++语言,用来简化RADOS层的拜访,并且提供librados API对RADOS进行本地化拜访。RADOS,全称是牢靠、主动、分布式对象存储(Reliable Autonomic Distributed Oject Store),是Ceph集群的根底,RADOS负责Ceph中的所有数据都以对象模式存储。RADOS层提供的个性次要有:数据一致性、可靠性,数据迁徙和再均衡。MON,Ceph的monitor组件,将集群的状态保留在几个map构造里,如OSD、MON、PG和CRUSH,集群内所有的节点都向MON组件上报信息,monitor将每一个组件将上报的状态信息存储在不同的map里,monitor不存储理论的数据,只存储集群状态信息。OSD,Ceph对外存储设备,负责数据读写操作,真正存储用户数据的组件,一个OSD守护过程与集群的一个物理磁盘绑定,一般来说,用于部署Ceph集群物理机器(或虚拟机)的磁盘数量与OSD守护过程数量是一样的。MDS,元数据服务器,只有Ceph FS才须要,对象存储场景不须要应用到MDS。小结本篇简略介绍了分布式存储组件Ceph的根本个性,实用的存储计划,以及Ceph架构的介绍,先简略理解一下Ceph组件职责,后续会针对每个组件作更具体的介绍,心愿对你有帮忙,谢谢。

September 30, 2022 · 1 min · jiezi

关于云存储:融云云盘不止于存储

受疫情管控影响,公司要求居家办公,老板放心员工居家短少材料耽搁工作,连夜让人力告诉大家,在公交地铁停运之前先到公司拷贝工作材料,如有必要可间接将电脑搬回家…… 本文转自公众号【融云 RongCloud】,回复【白皮书】收费获取社交泛娱乐出海残缺宝典。 —— 这是这几年随时产生在咱们身边的故事。电脑们回家了 疫情起起伏伏这些年,不确定成了惟一确定的事件。这种状况下,企业想要实现高效近程办公,是否具备切实好用的“云盘”工具就显得尤为重要。而在融云针对政企组织的挪动办公协同平台中,云盘便是很重要的模块化组件之一。 融云云盘具备哪些能力?一阶能力——云端存储管理各种类型的文件,比方文档、图片、录音、视频、设计图等,都可在融云云端基于组织架构进行归类和存储,各部门数据互相隔离,部门外部资源集中在一起,对外沟通的文件也能一键保留到云盘。对立积淀、对立治理企业工作成绩,打造组织本人的常识智库。 文件反对随时随地多端同步高速上传、下载、高级检索及在线预览。文件保留到云盘后,将主动同步到所有设施,开明权限的人可通过手机、电脑随时随地间接取用。而至于云盘存储能力到底有多大,则次要取决于两点:一是需要有多大,二是估算有多少。 二阶能力——一键共享散发当咱们须要跟外部共事或内部合作伙伴互传文件时,往往通过邮件或者 IM 通信工具。而当初,通过云盘也可间接实现。在融云云盘共享空间,所有文件批改都是实时同步的,大家随时随地关上的都是最新版本。文件动静会第一工夫告诉,空间成员可第一工夫响应。共事、内部客户、上下游合作伙伴可通过群聊、二维码、邀请链接等多种形式退出共享空间。 融云云盘文件的内外部拜访权限能够进行自定义设置,重要、密级文件均可进行权限设置,防止泄密。除可间接对内分享外,云盘对外分享也能一键实现,还可展现集体名片,通过文件分享拓展客户关系。 三阶能力——实时协同办公通过隐衷配置,融云云盘所有类型文件都反对@共事。对方收到音讯揭示后,可间接进行回复,确保充沛沟通、高效合作。而且文件主动同步多终端,反对海内外用户多人在线协同办公,存储、编辑、流转可一站式在线实现。 在云盘的应用场景上,融云反对依据组织架构建设合作文件夹,新人入职主动受权查看、编辑等性能,到职员工主动删除权限,确保数据安全,实现部门高效协同。也可依据我的项目建设合作文件夹,将我的项目成员增加为协作者,我的项目成员可随时查看最新版文件、及时更新我的项目进度、实时反馈我的项目问题,让我的项目单干更高效。 另外,融云云盘已实现 API 接口凋谢,可与企业现有信息系统集成。通过云盘,大文件也可高速稳固传输,实现深刻沟通高效互动。 四阶能力——轻松回溯审计不少人应该都遇到过,在文件操作记录中上传新版本,旧版本间接就被笼罩,日后想要回溯,已无处可寻。而融云云盘,上传新版本的同时可保留批改记录,确保历史版本可回溯,即使员工误删误改,也能轻松找回。 为确保数据安全,企业可对立治理所有共享空间,启用 IP 拜访权限,仅反对在可信 IP 内拜访云盘,保障拜访环境平安。为及时发现问题,管理员可通过审计成员操作日志,筛查危险行为,一旦查实还能进行溯源解决。 融云云盘可赋能哪些场景?云盘之于制造业近几年传统行业“上云”趋势显著,一些大型制作企业也开启“云盘”之旅。 大型制作企业业务体量大,业态多业务广,文档数量多且较为扩散,上司子公司、分公司、办事处等地区散布极广,组织架构宏大简单,业务材料跨区跨国传输频繁。 所以,如何围绕业务流程及相干数据促成项目管理,成为大型制造业企业“上云”外围诉求。融云云盘能够提供材料存储、跨区传输性能,尤其是对于像工程设计图这样体积大的文件,即使在弱网环境下,也能够通过云盘实现疾速传输,助力我的项目高效推动。 云盘之于金融业银行、保险等机构,须要存储大量客户信息和合同材料,还须要不断更新,合规性要求很高。 所以在应用云盘过程中,金融业机构最关注的是客户信息、合同材料存储和传输的安全性及便利性。在安全性上,融云云盘通过加密存储、数据隔离、权限治理等安全措施,帮忙各大机构实现数据安全合规存储与传输。在便利性上,融云云盘能够作为金融业机构的数据入口,通过文档和数据管理性能进行数据分析和趋势预判。 云盘,作为融云挪动办公协同平台的组件之一,不止具备繁多的文件存储性能,曾经开始向文件的共享散发、在线合作、协同办公等方面延长,致力于为更多组织提供高协同、易用性强、体验好的服务,帮忙组织实现内外部高效平安的共享与合作。

September 20, 2022 · 1 min · jiezi

关于云存储:理想汽车-x-JuiceFS从-Hadoop-到云原生的演进与思考

现实汽车在 Hadoop 时代的技术架构 首先简略回顾下大数据技术的倒退,基于我集体的了解,将大数据的倒退分了4个期间: 第一个期间: 2006 年到 2008 年。2008 年左右,Hadoop 成为了 Apache 顶级我的项目,并正式公布了 1.0 版本,它的根底次要是基于谷歌的三驾马车,GFS、MapReduce、BigTable 去定义的。 第二个期间: 2009 年到 2013 年阶段。雅虎、阿里、Facebook 等企业对大数据的利用越来越多。2013 年底 Hadoop 正式公布 2.0 版本。我有幸在 2012 年的时候开始接触大数据,用 Hadoop 1.0 加 Hive 的模式体验了下,过后感觉很神奇的,大数据用几台机器就能够疾速解决原来用 SQL Server 或者 MySQL 解决不了的问题。 第三阶段:2014 年到 2019 年,这段时间倒退的十分快,期间 Spark、Flink 都成为了 Apache 顶级我的项目。在这个疾速俯冲期的过程中,咱们还尝试用过 Storm,起初 Storm 就被 Flink 所代替了。 第四阶段: 从 2020 年至今,2020 年 Hudi 从 Apache 毕业成为顶级我的项目之后,我集体了解数据湖进入到整个倒退的成熟期,到了大数据的数据湖 2.0 阶段。数据湖次要三个特点,首先是对立、开放式的存储,其次是开放式的格局,以及丰盛的计算引擎。 整体的倒退过程中,大数据次要是有几个特点,就是大家常说的四个“V”:规模性(Volume)、高速性(Velocity)、多样性(Variety)、价值性(Value)。当初还有第五个“V”(Veracity),数据的准确性和可信赖度。数据的品质是始终被人诟病的,心愿行业里能有一套规范把数据湖的品质去做晋升,这个可能是数据湖 2.0 呈现的规范,因为呈现了 Hudi、Iceberg 这些我的项目,都是想把整个数据湖的治理做好。 集体感觉 Hadoop 是大数据的一个代名词,然而大数据并不只有 Hadoop。大数据是在倒退过程中由多个组件整合之后造成的一套解决大量数据加工解决和应用的解决方案。这几年,大家基本上认为 Hadoop 是在走下坡路的,首先是 Hadoop 商业化公司 Cloudera 和 Hortonworks 的合并和退市,原来的商业模式无奈连续;也面临着快速增长的云供应商在老本和易用性上的挑战,以及 Hadoop 自身生态系统的日益简单。 ...

August 24, 2022 · 4 min · jiezi

关于云存储:JuiceFS-新手必知-24-问

JuiceFS 是一个创新性的软件产品,很多首次尝试的小伙伴对产品和用法感到很多纳闷,所以为了帮忙大家疾速了解并上手 JuiceFS,咱们整顿了24个对于 JuiceFS 经典的问题答案,置信通过这 24 问,大家对 JuiceFS 会有更清晰的意识,应用上也会更加得心应手。 1. JuiceFS 的根本能力是什么JuiceFS 是一款面向云原生设计的高性能共享文件系统,在 Apache 2.0 开源协定下公布。提供齐备的 POSIX 兼容性,可将简直所有对象存储接入本地作为海量本地磁盘应用,亦可同时在跨平台、跨地区的不同主机上挂载读写。 2. JuiceFS 的性能如何JuiceFS 是一个分布式文件系统,元数据拜访的延时取决于挂载点到服务端之间 1 到 2 个网络来回(通常 1-3 ms),数据拜访的延时取决于对象存储的延时 (通常 20-100 ms)。程序读写的吞吐量能够到 50MiB/s 至 2800MiB/s(查看 fio 测试后果),取决于网络带宽以及数据是否容易被压缩。 JuiceFS 内置多级缓存(被动生效),一旦缓存预热好,拜访的延时和吞吐量十分靠近单机文件系统的性能(FUSE 会带来大量的开销)。 3. JuiceFS 的运行的必要条件在运行前,须要筹备元数据引擎与对象存储, 元数据引擎中存储的是文件的名称,大小,批改工夫等元数据,而对象存储中存储的是文件的内容。 元数据引擎以后反对:Redis,TiKV,MySQL,PostgreSQL等,以后元数据引擎的反对清单与具体配置参考如何设置元数据引擎文档 对象存储反对的就更多了,根本常见的对象存储都反对了,比方 AWS S3,阿里云 OSS,华为云 OBS,腾讯云 COS等等,另外为了不便测试,还特地反对本地磁盘作为对象存储。以后对象存储的反对清单与具体配置参考如何设置对象存储文档 4. JuiceFS 应用的步骤应用步骤非常简单,分两步,第一步格式化,第二步挂载到本地。上面就是应用 JuiceFS 与 Redis 将阿里云 OSS 挂载到本地的示例: # 1. 格式化一个文件系统juicefs format \--storage oss \--bucket https://zhijian-dev.oss-cn-hangzhou.aliyuncs.com \--access-key xxxx \ --secret-key xxxx \redis://localhost:6379/1 \test1 # 2. 后盾挂载文件系统到 /tmp/jfs 目录juicefs mount -d redis://localhost:6379/1 /tmp/jfs5. 最快体验 JuiceFS 的形式我本地没有 Redis,也没有对象存储,是否体验 JuiceFS 那 ?当然能够,拉起 JuiceFS 服务须要元数据引擎以及对象存储两个组件,但在这两个组件咱们能够应用最简略的,比方元数据引擎用 SQLite这个嵌入式数据库,而对象存储应用本地磁盘(format 时的—bucket参数不填即为默认参数,默认为应用本地磁盘作为对象存储,root 用户默认存储门路为 /var/jfs,普通用户默认存储门路为 ~/.juicefs/local)。这样就能够只须要 JuiceFS 二进制不须要任何内部组件就能体验 JuiceFS 产品了。 ...

August 3, 2022 · 4 min · jiezi

关于云存储:鱼和熊掌可以兼得天翼云弹性裸金属一招鲜

在“攻城略地”的寰球云计算倒退大潮中中国异军突起天翼云作为一支云服务国家队也在一直“武装”本人虚拟化的过程在为用户带来低成本、高灵活性的同时损耗和高性能场景也给用户带来了焦虑作为天翼云4.0变革产物之一“天翼云弹性裸金属服务器” 全新问世它都有哪些奇功妙招能罢黜用户焦虑帮忙企业上云?天翼云为你逐渐揭晓答案 正式介绍之前,咱们先理解什么是裸金属?裸金属服务器是物理机与云服务器的联合,具备物理机级别的残缺处理器个性以及物理机级别的资源隔离劣势,同时具备云服务器的弹性灵便属性,实现了超强超稳的计算能力。 弹性裸金属“弹”在哪?传统裸金属不具备动静调整硬件资源的能力,而弹性裸金属的硬件资源能够灵便调整,并有着传统物理机平安物理隔离的特点,具备和云主机近乎雷同的应用体验。很多客户在外围业务上云过程中,既想领有虚拟机弹性扩容、灵便配置的劣势,又想实现物理机高性能运算、资源独享的个性。 **鱼和熊掌兼得让天翼云弹性裸金属服务器帮你实现** Step1升高损耗 为经营续航天翼云弹性裸金属服务器采纳自研软、硬一体化架构,为网络和存储的硬件加速,打消虚拟化对资源的损耗,将可用资源比例晋升20%以上,实现虚拟化零损耗。它还反对解决网络传输中服务器端的数据提早,可能让端到端的存储网络提早升高40%。 Step2一键迁徙 交付率晋升100%高度的资源配置灵活性,可能将交付效率晋升100%。无缝迁徙,实现云化资源的便捷发放和治理。满足客户对于高稳固、高平安、高性价比的需要,保障业务一键迁徙、疾速上云。 Step3独享CPU 开释更多算力艰深来讲,和物理机一样,天翼云弹性裸金属服务器提供专属CPU和内存资源,通过将网络和存储等业务卸载到智能网卡,并通过专用硬件加速,从而极大的升高了对CPU和内存等资源的耗费,同时性能远超通用虚构服务器,让用户独享算力资源;更有高度兼容性,同时兼容X86和ARM等处理器架构,反对国产处理器芯片的适配,推动核心技术自主可控。 天翼云弹性裸金属服务器不仅具备了物理机性能的劣势,还领有虚拟机的灵便劣势。在外围业务上云的方程式里,天翼云弹性裸金属服务器或者是更优解。哪些业务场景下会用到它呢? ● 业务场景外围数据库承载着企业要害外围数据,对数据安全有着极高要求。天翼云弹性裸金属服务器满足云上外围数据对于高内存、高性能的部署要求,保障多重业务高可用和数据高牢靠。 同时,在企业上云过程中,天翼云弹性裸金属服务器反对嵌套虚拟化,能够实现用户独享的计算资源,解决在共享环境下业务高峰期性能瓶颈问题,并能晋升根底业务撑持灵便度,便捷零碎经营治理。 而高性能、高存储性的天翼云弹性裸金属服务器能满足在大数据计算利用场景下,对性能的极致要求,可构建高平安、高牢靠、高灵便资源调度的集群部署环境。 人工智能方面,天翼云弹性裸金属服务器采纳业界先进的GPU硬件提供弱小的多指令算法。可满足深度学习训练、科学计算、图形图像解决、视频编解码等场景;通过共享数据,反对集群扩大,满足人工智能场景的算力需要。 金融证券行业中,对平安合规与业务连续性的要求极高,保障数据安全稳固是重中之重。天翼云弹性裸金属服务器采纳多正本技术冗余存储,保障了数据的可靠性,实现数据零失落,同时满足对敏感数据的可监管和可追溯。 在时机和挑战并存的明天,天翼云保持云上深耕,凭借丰盛的场景化实际一直打磨产品,力求构建残缺弱小的技术组合与产品图谱,助力企业实现高质量数字化转型降级。

July 5, 2022 · 1 min · jiezi

关于云存储:如何使用-etcd-实现分布式-etc-目录

etcd 是一款兼具一致性和高可用性的键值数据库,简略、平安、疾速、可信,目前是 Kubernetes 的首要数据存储。咱们先来看一段 etcd 官网对于名字的解释。 The name “etcd” originated from two ideas, the unix “/etc” folder and “d"istributed systems. The “/etc” folder is a place to store configuration data for a single system whereas etcd stores configuration information for large scale distributed systems. Hence, a “d"istributed “/etc” is “etcd”.下面一段话来源于 etcd 官网,etcd 富裕想象力地把etc (Linux 零碎通常用来存储配置文件的中央) 与 distributed (分布式) 两个概念联合在了一起,然而,因为 etcd 通过 HTTP API 提供服务,因而”遗憾”地没能实现一个真正的分布式 /etc 目录。上面咱们将介绍,如何通过 JuiceFS,帮忙 etcd 实现一个真正的分布式 /etc 目录。 ...

June 23, 2022 · 2 min · jiezi

关于云存储:内卷时代企业网盘应选择公有云托管还是私有云自建

当企业倒退到了肯定快车道阶段,外部流通的文档量到了肯定水平,很天然的就面临着如何更平安无效的治理外部的文档,使到常识的传递更加高效,新员工能更疾速的复用老常识,也防止了资深老员工到职导致企业常识断档。而选型的第一个大拷问天然是到底企业应该抉择将文档治理托管到私有云大厂上,还是自建一套企业公有云盘或文档管理系统呢?这里给大家做一些剖析,欢送大家参加探讨。 公有部署的网盘产品公有部署网盘产品,数据安全更让企业决策层释怀。 从技术角度来说,并不是说私有托管在安全性上就差,事实上,敢做网盘私有托管的大厂像阿里云、腾讯每年在平安上的投入微小,迄今也没呈现过一例数据安全泄露事变,所以技术层面的平安保障,只有抉择了大厂,根本是无需担心的,但抉择非大厂的产品的话须要本人掂量掂量一下,简直不会有业余的平安团队来保障的,对少数企业来说,平安投入又不会产生支出,国内器重水平是很低的。但公有部署因为内外网有一道物理隔离,施行办法也曾经历经几十年的测验了,早已有很多成熟的IT实际和配套的产品来保障这种平安了,即便产品层面存在肯定的平安缺点,也不会是致命的,想想如果黑客都攻入你内网了,那么企业关怀的就绝不仅仅是繁多产品的问题了。。。对于大多数IT业务都在内网的企业,贸然将外围数据放到一个私有云上,可能还会减少IT平安危险。 公有部署网盘产品,性能的丰盛和细节细腻水平通常做得较好。 在性能层面,公有部署的网盘产品和传统软件更贴近,像协同治理、权限管控、文档根底治理等各方面会做得更加丰盛和粗疏,而私有托管的产品,因为其面向的客户基数较大,所以每减少一个性能,都须要思考其普适性、和私有云大厂的其余产品的协同性以及托管的老本,制约比拟大,所以察看钉钉、企微、飞书等几个大厂的云盘产品,根本能够看出其性能还是比拟根底的,不如公有网盘类产品。 公有部署署网盘产品,与企业成熟的IT实际更符合,更加可控。 对于IT零碎较多的企业,通常外部曾经有一套Windows域账号或LDAP零碎做单点登录了,购买个云服务还得多治理一套账户体系;如果想要将数据做备份,根本就是传统的文件同步、数据库备份等成熟的做法,而云端呢?通常来说你是接触不到底层的设施,你只能依附云厂商的承诺,国内大厂这类产品临时还没有呈现过数据失落的事变,但呈现过数据中心网络局部中断导致的不可拜访;再比方你想要和你的其余IT零碎买通,云厂商在这方面做得是比拟激进甚至缺失的;再比方带宽、容量等,如果文档容量十分大,那么每年的云费用还是很可观的,通常企业有很多旧服务器,资产老本是非常低的,但品质其实是很不错的,将这些磁盘弄个分布式存储,而后挂载到公有网盘上,从利旧和老本管制的角度来说是很好的实际。 私有云托管云盘产品私有托管云盘产品,对初创企业来说非常灵活,节约运维老本。 不得不说,现如今SaaS服务遍地开花,对于初创或中小型企业来说还是十分利好的。像腾讯的企业微信、阿里的钉钉面向初创中小企业全都是收费的,大大节约了企业的经营老本。有些企业从一开始就全套采纳了云端的服务,他们在云端IT实际的积攒是十分多的。而且把数据的平安和运维可靠性交给了云厂商,本人就不须要装备太业余的运维人员,也是节约人力老本的措施。 私有托管云盘产品,利于互联网化近程合作。 对于常常须要近程办公协同或者和客户共享材料的企业业务来说,利用互联网公开服务来实现这一点基本上体验是要完胜公有部署的厂商,毕竟私有托管的厂商从出世就是做toC的,更重视用户体验。国内疫情的环境下,裸露了很多企业在协同工具方面的落后性,连VPN都没有筹备好。有些企业为了简略间接将公有部署的网盘裸露在公网上,殊不知很多公有部署的网盘纯正从技术安全性角度来说,是不如私有云大厂做得好的,所以还是有较大的危险。 选型总结总结一下,如果企业少数外围业务都在传统IDC内网或者私有云虚构内网环境里的,而且网盘是心愿用于长期积攒外围数据资产的,倡议采取公有部署,并抉择专一公有部署的厂商,不专一的结果就是中间都做不好;对于生在云端的企业或者材料并没有那么外围的,能够偏向于思考私有托管。 你的企业用的是什么计划呢?欢送来评论区给大家分享一下吧!

May 16, 2022 · 1 min · jiezi

关于云存储:JuiceFS-v10-beta3-发布支持-etcdAmazon-MemoryDBRedis-Cluster

JuiceFS v1.0 beta3 在元数据引擎方面持续加强,新增 etcd 反对小于 200 万文件的应用场景,相比 Redis 能够提供更好的可用性和安全性。同时反对了 Amazon MemoryDB for Redis 和 Redis Cluster。至此,JuiceFS 反对的元数据引擎有: Redis:包含单机、Sentinel 和 Cluster 模式,适宜小于 1 亿文件,同时谋求高性能的场景。基于 AOF 的异步复制有大量数据失落的危险,Amazon MemoryDB for Redis 应用同步数据复制,数据安全性更高;关系型数据库:包含 MySQL、MariaDB、PostgreSQL,适宜数据安全要求高,性能要求不高的场景;TiKV:适宜海量文件(1 亿以上),对性能与数据安全都有高要求的场景,但运维门槛比后面的计划高;etcd:适宜小于 200 万文件并且可用性与数据安全要求高的场景;嵌入式数据库:包含 BadgerDB 和 SQLite,适宜不须要多机拜访的场景应用。除了元数据引擎的降级,JuiceFS S3 网关也提供了多租户、权限设置等高级性能,同时反对了非 UTF-8 编码的文件名。 本次更新共有 22 位社区贡献者参加奉献了超过 240 次提交,感激每一位的付出,也欢送正在读文章的你参加到 JuiceFS 社区中来。 上面,来为你解读一下 JuiceFS v1.0 beta3 的具体变动。 新增 etcd 元数据引擎 etcd 是一个数据牢靠的分布式 KV 存储系统,在 Kubernetes 中宽泛应用,etcd 的数据批改会同步写到磁盘上,保障数据安全,通过 Raft 共识算法实现数据复制和故障切换,实现高可用。相比应用异步落盘和异步复制的 Redis 有更好的数据安全性和可用性。 但 etcd 可能撑持的数据规模比拟无限,从理论测试来看,小于 200 万文件时,是个不错的抉择。 ...

May 7, 2022 · 2 min · jiezi

关于云存储:JuiceFS-在数据湖存储架构上的探索

大家好,我是来自 Juicedata 的高昌健,明天想跟大家分享的主题是《JuiceFS 在数据湖存储架构上的摸索》,以下是明天分享的提纲: 首先我会简略的介绍一下大数据存储架构变迁以及它们的优缺点,而后介绍什么是 JuiceFS,其次的话会再重点介绍一下对于 JuiceFS 和数据湖的一些联合和关联,最初会介绍一下 JuiceFS 和数据湖生态的集成。 大数据存储架构变迁纵观整个大数据存储架构的变迁,能够看到有非常明显的三个阶段:第一个阶段就是从最早的 Hadoop、Hive 等我的项目诞生之后,有了数据仓库(Data Warehouse)的概念。随着数仓的逐渐倒退,同时有了云的诞生,对象存储的诞生,以及大数据与 AI 的时代到来之后,数据湖(Data Lake)这个概念就被凸显了进去。最近两三年有一个新的概念,或者是说到了一个新的阶段叫做湖仓一体(Lakehouse)。传统数仓大家都比拟理解,明天会着重看一下前面这两个阶段,也就是数据湖和湖仓一体。 为什么要有「数据湖」?数据湖很重要的一个诞生契机,其实是解决数据孤岛(Data Silos)问题。产生数据孤岛的根本原因,来自于不同的业务或者不同团队,因为一些历史起因造成了数据之间其实是一个孤岛或者相互之间没有方法去做连贯。 随着不同业务的引入,在企业外部数据的格局会变得越来越多样,除了最早的传统的结构化数据以外,会发现还有很多半结构化的甚至是非结构化的数据。这些半结构化和非结构化数据也心愿能逐渐引入到整个公司的数据管理或者运维外面来,传统数仓的架构或者说存储的模型此时就没有方法去满足这种多样性的数据格式的存储需要。 而后第三点是扩散的数据管理,这点其实是跟第一点数据孤岛也是有关联的。因为你的数据是散布或者扩散在很多不同的中央的,数据的治理或者一些权限的管制上,也会绝对的扩散。这个时候你如果要去针对不同的业务与不同的团队去做治理,也会是一个比拟大的工作量。 第四点是存储与计算的耦合(简称「存算耦合」),也是跟传统 Hadoop 的架构无关,传统的像 HDFS、YARN 的架构,是针对存算耦合架构来设计的,但在对于当初基于私有云的大数据架构来说,这种存算耦合的架构就比拟不足弹性了,不论是在运维的弹性上,还是对老本的管制上。 最初一点随着 AI 行业的倒退,在机器学习或深度学习这块的数据退出进来之后,也是心愿可能在数仓或者说整个大数据架构外面为基于机器学习或深度学习的业务提供更好的反对。不仅是存储数据,例如还须要对接深度学习的框架,所以就要提供一些接口的反对,比方 POSIX 等对算法工程师更敌对的形式,而不是传统的通过 SQL 或一些其它的形式来提供给业务团队。 什么是「数据湖」?这里援用维基百科上的一句简介: A data lake is a system or repository of data stored in its natural/raw format, usually object blobs or files.其中一个比拟重要的定义是 natural/raw format(原始格局),跟传统数仓比拟大的区别是咱们会偏向于把数据以原始的格局先存到数据湖外面来。数仓其实也还是存在的但它是一个后置的过程,为了实现这样一个数据湖,最基本的是须要一个足够便宜且可能反对海量数据规模的底层存储。目前看下来在云上的话,对象存储是一个十分好的抉择,它既做到了便宜牢靠,同时也可能反对海量的数据。但对象存储也不是一个相对的计划,前面会具体地去做一些比拟。 简略来说就是「 Everything in one place」,意思是所有数据都先放到数据湖外面来,你要做数仓也好,做一些其余的后置 ETL 也好,那是下一个阶段的事件,但前提是要把所有的数据都放在一起。「后置 ETL」的意思是说 ETL 仍然存在也仍然须要,只是它变成了一个后置的流程。因为用到了对象存储,以及存算拆散的架构,所以在整个的架构设计上也会更加的云原生 。 为什么要有「湖仓一体」?在整个数据湖的架构外面数仓仍然是存在的 ,然而它在整个 pipeline 的阶段被后置了,必然就会带来一些数据的滞后。同时传统的像 Hive 这些组件,其实你要做到近实时或者基于 Hive 来做增量的数据更新是比拟麻烦的,特地是如果你要把分区(partition)的工夫窗口缩得很短的话。 ...

May 5, 2022 · 3 min · jiezi

关于云存储:小团队如何妙用-JuiceFS

早些年还在 ENJOY 的时候, 就曾经在用 JuiceFS, 并且一路随同着我工作过的四家小公司, 这玩意对我来说, 曾经成了理所应当不可或缺的基础设施, 对于我服务过的小团队而言, 更是实实在在的好帮手. 趁着最近的征文活动, 持续拓展一下我的小团队系列, 介绍下多年来咱们团队都在如何应用 JuiceFS. 不过这里讲到的用处, 恐怕都不算什么"妙用", JuiceFS 是一个大社区了, 这些用法恐怕早被玩的滚瓜烂熟, 不过不妨, 本文其实是外部我的项目文档的拓展, 次要记录一些保护过程的心得体会. 妙用: 容器共享存储尽管曾经有了 CSI 反对, 但咱们始终以来都将 Juicefs 挂载到所有 Kubernetes 节点的 /jfs, 这样一来, 所有容器利用都能轻松以 hostPath 形式来挂载宿主机目录, 而后就有了共享存储了. 此法的一些须要留神的中央: jfs.mount 必须先于容器服务启动, 毕竟二者建设依赖关系了. 以 docker 为例, 能够这么写:# /etc/systemd/system/docker.service.d/12-after-jfs.conf[Unit]After=jfs.mount要挂载的目录必须先手动创立进去, 设置好权限(使之与容器过程 uid 匹配), 这点其实不太不便, 如果你的团队受不了这番折腾, 就间接用 CSI 吧.集群扩容存在肯定不便之处, 毕竟此法要求所有节点都挂载好 JuiceFS. 万一 Kubernetes 集群冗余不够了, 须要退出新节点, 还须要多做一步挂载 JuiceFS, 能力退出集群. 在极限状况下, 这样的设计还挺耽误时间的, 又多了一个间接用 CSI 的理由.讲了这么多问题, 那看上去的确应该首选 CSI 而不是 hostPath 了, 不过 hostPath 就胜在治理更简略, 推理更加直白, 因为按照咱们的应用常规, 都会采纳相似 /jfs/[appname]-[cluster] 的命名, 比拟高深莫测, 对于不相熟 Kubernetes PV 那一套的共事而言, 做事件也更加不便一些. ...

April 1, 2022 · 5 min · jiezi

关于云存储:如何选择天翼云云硬盘

天翼云提供一般云盘(SATA)、高效云盘(SAS)、SSD云盘(SSD)三种类型的云硬盘,这三种类型有什么区别,又别离实用于什么场景呢?明天就来说一说这个问题。首先咱们理解一下什么是云硬盘。云硬盘即云主机应用的存储设备,购买云主机后操作系统、应用软件数据都保留在云硬盘上。实质上它是天翼云分布式存储池中划分进去的一个虚构磁盘设施,在应用上和一般服务器的硬盘没有任何区别。 云硬盘有几个特点:1.云硬盘不能孤立存在,必须挂载到云主机或物理机上应用,也就说独自购买一个云硬盘而不购买云主机是没法应用的。 2.天翼云的分布式存储曾经进行了三正本冗余,能够了解为一份数据同时保留了三份,相似于传统存储的RAID。传统服务器在购买时个别至多购买两块硬盘用于冗余,购买云硬盘就不须要思考这个问题,因为云硬盘曾经进行了冗余。 3.云硬盘能够十分不便地进行扩容,比方原来购买的空间不够用了,能够在停机后进行扩容,不会影响云硬盘上已有的数据。 4.云硬盘能够从一台云主机上卸载,再挂载到另一台云主机上。就如同优盘能够从一台电脑上拨出插到别一台电脑上应用一样。 理解了云硬盘后,咱们再看看一般云盘、高效云盘、SSD云盘是指什么。这三种类型的云硬盘在架构是完全相同的,区别在于它们所应用存储介质以及接口不同,导致它们的性能以及应用场景也有所区别。 首先硬盘分为机械硬盘和SSD硬盘两种,机械硬盘是靠一个可挪动的磁头在疾速旋转的盘片上进行读写,就像老式的留声机一样。机械硬盘有一个很重要的参数是转速,即盘片每秒旋转的次数,所以称之为机械硬盘。 而SSD硬盘是指固态硬盘,它应用存储芯片作为存储介质,齐全没有磁头、盘片这些机械构造。SATA、SAS都是指硬盘和服务器主板之间的连贯总线,除了SATA、SAS外,还有IDE、SCSI、PCIE等其它类型的总线。SATA及SAS是目前应用最为宽泛的总线。 这样机械硬盘、SSD硬盘两种硬盘加上SATA、SAS两种总线,就会组合为四种类型的硬盘。 说完了硬盘的类型,再聊一下硬盘的两个最重要的指标IOPS和吞吐量别离是指什么。咱们用快递员收发快递来打一个比如。当初城市的各个角落都有了快递箱子或者菜鸟驿站,这些箱子或者驿站就像硬盘的存储空间,快递员去收发快递的过程就像硬盘上的磁头去读写数据。为了提高效率,快递公司在送快递前会把同一个小区的快递都提前分捡到一块,不便一次投递好。对应到硬盘的数据读写,如果读写的数据是间断的那么磁头就不必到处跑,这样读取的速度也会更快,这就叫程序读写。如果快递员没提前分捡好,快递员须要到处跑,这就叫随机读写。快递员均匀每个小时收发的快递数量咱们就称之为IOPS(磁盘均匀每秒的读写次数),均匀每个小时收发的快递分量咱们就称之为吞吐量(磁盘均匀每秒的读写数据量大小)。一般云盘应用的存储设备为SATA机械硬盘。SATA机械硬盘次要用于个人电脑,当初绝大多数个人电脑的硬盘都是SATA接口。SATA在设计时次要面向性能和可靠性要求不高的场景,因而能把单个硬盘的容量设计得很高,所以SATA硬盘价格便宜、性可能用。一般云盘次要实用于容量高、读写速度要求不高的场景。 高效云盘应用的存储设备为SAS机械硬盘。SAS机械硬盘是针对高吞吐量、低提早、高可靠性的场景来设计的,为了保障高吞吐量和低提早使得SAS磁盘的转速更高、硬盘的发热更高,而为了保障高可靠性又使得SAS磁盘的单硬盘容量没法像SATA硬盘那么高,因而SAS机械硬盘比SATA机械硬盘的性能更好,但价格也更高。高效云盘实用于绝大多数场景,次要用于承载利用程序运行的环境。SSD云盘应用的存储设备为SAS固态硬盘。SSD硬盘没有机械硬盘的寻道过程,因而吞吐量、IOPS都十分高,特地实用于随机读写的场景。因而SSD云盘次要实用于对IO要求十分高的场景,比方用于存储数据库的数据文件。咱们用一个表格总结一下三种云盘的参数以及适应场景。 在理论利用中,咱们能够组合几种云硬盘来应用,使云主机的的性价比最优。比方系统盘应用一般云硬盘了,应用高效云硬盘部署利用及数据库,SSD云硬盘存储数据库的数据文件,最初再应用一般云硬盘做数据备份。

March 23, 2022 · 1 min · jiezi

关于云存储:云上共享文件系统的兼容性大比拼

「所有皆文件」是 UNIX 的根本设计哲学。文件依照层级关系组织为树形目录,形成了文件系统 的根本状态。用户应用文件系统来保留数据时,不用关怀数据底层的存储形式,便能够依照约定的接口标准进行拜访。 概念篇对于文件系统的接口标准,利用最为宽泛的莫过于 POSIX,源于 IEEE 委员会编写的相干规范,其中有些章节是对于文件及目录操作的。规范自身比拟简短艰涩,在此不作深入探讨。咱们能够参考 Quora 上的一个问答 “What does POSIX conformance/compliance mean in the distributed systems world?” ,对此概括的比拟全面。 POSIX 兼容要求文件系统具备以下几项特色: 层级化的目录构造,反对任意深度文件通过 open(O_CREAT),目录通过 mkdir 创立等等目录能够通过 opendir/readdir 遍历门路/命名空间能够通过 rename 、 link / unlink、 symlink / readlink 等批改数据通过 write 或 writev 写入, fsync 时要求长久化,通过 read 或 readv 读取其余一些接口如 stat, chmod / chown 等与某些风行的说法相悖,扩大属性看起来并不是 POSIX 的一部分,参见The Open Group Base Specifications Issue 7, 2018 edition 里的函数列表测试篇一个文件系统是否真正满足 POSIX 兼容性,咱们能够通过测试工具来测验。比拟风行的一个测试用例集是 pjdfstest,来源于 FreeBSD,也实用于 Linux 等零碎。pjdfstest 的测试用例须要以 root 身份来运行,并且要求零碎里装置了 Perl 和 TAP::Harness(Perl 软件包),测试过程如下: ...

March 3, 2022 · 4 min · jiezi

关于云存储:让-JuiceFS-帮你做好异地备份

家住北京西二旗的小张是一家互联网金融公司的运维工程师,金融行业的数据可是很值钱的,任何的损坏和失落都不能容忍。 为此,小张选了北京品质最高的机房,买了品质最好的硬件,做了全面的数据备份容灾策略: 每 24 小时做一次全量备份,每 1 小时做一次快照备份,还有每 5 分钟的增量备份。备份的数据存于专门的备份服务器,在分布式系统中会有 3 拷贝冗余,而且还思考了跨机架的正本搁置策略。每个环节都有监控和报警,零碎运行良好,各种故障都能及时锁定及时处理。 但这样,数据容灾策略能够十拿九稳么? 在一个炎炎夏日的黄昏,小张完结一天的工作,终于能够回家享受啤酒小龙虾了。谁想天气渐变,狂风暴雨电闪雷鸣,小张电话响起: 机房被雷劈了!还被劈了三次!!!! 小张连忙赶回去抢救,通过万般致力,得以复原大部分数据,然而仍有大量数据无奈复原,因为这部分数据的所有正本所在的硬盘损坏了 … 这个故事看上去不堪设想,然而生存往往比实在更戏剧化,这种「被雷劈」的故事实在产生过,我身边有人遇到过,连 Google 这种大公司也遇到过。 2015 年 8 月,Google 欧洲的数据中心 europe-west1-b 就遭逢了人祸,被雷劈了!只管 Google 的灾备计划非常紧密,但依然有大量的数据永恒失落了。Google 在官网的事变报告的最初给出了一段对于备份安全策略的倡议,原文如下: We would like to take this opportunity to highlight an important reminder for our customers: GCE instances and Persistent Disks within a zone exist in a single Google datacenter and are therefore unavoidably vulnerable to datacenter-scale disasters. Customers who need maximum availability should be prepared to switch their operations to another GCE zone.粗心是 Google 云平台上一个区的计算实例和存储盘存在繁多数据中心危险,无奈防止数据中心级别的劫难。揭示客户做好本人的异地备份,以保障最佳的数据安全。 ...

February 15, 2022 · 2 min · jiezi

关于云存储:JuiceFS-在理想汽车的使用和展望

现实汽车是中国新能源汽车制造商,设计、研发、制作和销售奢华智能电动汽车,于 2015 年 7 月创建,总部位于北京,已投产的自有生产基地位于江苏常州,通过产品翻新及技术研发,为家庭用户提供平安及便捷的产品及服务。 在中国,现实汽车是胜利实现增程式电动汽车商业化的先锋,首款及目前惟一一款商业化的增程式电动汽车车型现实 ONE 是一款六座中大型奢华电动 SUV(运动型多用途汽车), 装备了增程零碎及先进的智能汽车解决方案,于 2019 年 11 月开始量产, 并于 2021 年 5 月 25 日推出 2021 款现实 ONE。截至 2021 年 12 月 31 日,现实汽车已交付达 124,088 辆现实 ONE。 背景依据国家相干法规和规范,新能源汽车行驶过程中须要将外围组件的信号数据进行收集并上报到政府建设的新能源汽车数据平台中,这些数据的起源有发动机、电池等核心部件。同时监管部门也要求汽车厂商存储这些数据撑持后续的售后保护、OTA 降级,车辆的健康状况检测、晚期预警、以及维修保养等。为了更好的服务用户,现实汽车开始自建数据平台。 致力于发明挪动的家,成为寰球当先的智能电动车企业的现实汽车,其所要治理的数据,规模是十分宏大的。在明天这篇文章中探讨的还仅仅是现实汽车产生的时序信号数据。汽车数据平台的架构中,全量的时序信号数据存储在 HDFS 中,同时也应用 Hadoop 技术栈依据业务需要实现各种简单的计算和剖析工作。 2021 年 12 月,现实汽车交付 14,087 辆现实 ONE,同比 2020 年 12 月增长 130.0%。2021 年 1 月至 12 月,现实 ONE 总计交付 90,491 辆,同比 2020 年增长 177.4%。自交付以来,现实 ONE 累计交付量已达 124,088 辆。可想而知,数据平台治理的车辆数据的增长也是极快的,这对数据平台的敏捷性和弹性都提出了十分高的要求。 玩转大数据的老司机都晓得,HDFS 的扩容费时费力,有时甚至难以跟上业务的增长速度。面对业务疾速倒退和不那么弹性的 HDFS,保护数据平台的工程师们有时只好删除有效、冗余数据,均衡各数据节点的数据,来缓解业务对于敏捷性的高要求和 HDFS 不那么弹性的矛盾。另外,因为 Hadoop 是存储和计算耦合的设计,减少存储空间的同时也须要减少计算,而往往存储和计算的匹配是错位的,不匹配的扩容也会也会带来很多算力冗余,制作不必要的节约。 ...

January 20, 2022 · 2 min · jiezi

关于云存储:JuiceFS-v100-Beta1-发布加强数据安全能力

在 JuiceFS 开源一周年之际,咱们迎来了首个里程碑版本 JuiceFS v1.0.0 Beta1,并将开源许可从 AGPL v3 批改为 Apache License 2.0。 JuiceFS v1.0.0 Beta1 是一个在生产环境中充沛验证迭代的产物,在连续 JuiceFS 一贯凋谢、平安、稳固、牢靠的品质之上,进一步提供一系列紧贴用户需要的全新性能。 亮点一:回收站数据误删这样的状况总是在你我身边一次又一次演出,周期性备份尚且无奈根治,咱们须要的是让删除操作能够有盘旋的余地。 明天,JuiceFS 正式解锁这项对于数据保护来说十分重要的性能——回收站。 从 JuiceFS v1.0.0 Beta1 开始,文件系统默认开启回收站,任何对文件的删除都会先被挪动到回收站,能够随时找回误删的文件。 如果你的 JuiceFS 文件系统常常产生删除操作,回收站可能会占据很多的空间(默认保留最近 1 天的删除数据),你能够调整设置让 JuiceFS 定期清理回收站中的文件。 对于新创建的文件系统,能够在 format 命令中指定 --trash-days 选项,比方 --trash-days 3 代表回收站主动清理寄存超过 3 天的文件。 对于曾经在用的文件系统,能够通过新增的 config 命令调整回收站清理规定,例如: $ juicefs config "postgres://user:$PG_PASSWD@127.0.0.1:5432/jfs1" --trash-days 3 对于回收站的具体介绍,请查看 JuiceFS 官网文档。 亮点二:元数据主动备份对于数据和元数据拆散存储的分布式文件系统,元数据的平安和残缺间接决定了整个存储系统的平安和残缺。 于咱们而言,数据安全绝不是指标,而是始终尽心保卫的底线。 早在 JuiceFS v0.15.2 咱们就减少了备份和复原元数据的 dump 和 load 命令,让用户能够依据理论须要定期备份元数据,从而在根底的数据库备份层面之上又减少了一重对元数据的平安保障。 明天,咱们又减少了一重保障——元数据主动备份。 从 JuiceFS v1.0.0 Beta1 开始,不管文件系统通过 mount 命令挂载,还是通过 JuiceFS S3 网关及 Hadoop Java SDK 拜访,每小时都会主动备份元数据并拷贝到对象存储。 ...

January 18, 2022 · 1 min · jiezi

关于云存储:JuiceFS-数据加密原理

JuiceFS 作为散布文件系统,每天与海量的数据打着交道,因而数据的安全性尤为要害,明天就来介绍一下 JuiceFS 在数据加密方面所做的致力。 传输中数据加密JuiceFS 在网络上传输时会对数据进行加密,以避免未经受权的用户窃听网络通信。 JuiceFS 客户端始终应用 HTTPS 把数据上传到对象存储服务,以下状况除外: 应用外部端点上传至阿里云 OSS应用外部端点上传至 UCloud US3静态数据加密JuiceFS 反对静态数据加密,即在上传到对象存储之前对数据进行加密。在这种状况下,存储在对象存储中的数据将会被加密,这能够在对象存储自身被毁坏时无效地避免数据泄露。 JuiceFS 在客户端加密中采纳了行业标准的加密形式(AES-GCM 和 RSA)。加密和解密是在 JuiceFS 客户端进行的。用户惟一须要做的是在 JuiceFS 挂载时提供一个私人密钥或明码,并像一般文件系统一样应用它。它对应用程序是齐全通明的。 留神:在客户端缓存的数据是不加密的。不过,只有 root 用户或所有者能够拜访这些数据。如果要把缓存的数据也加密,你能够把缓存目录放在一个加密的文件系统或块存储中。加密和解密办法必须为每个加密的文件系统创立一个全局 RSA 密钥 M。在对象存储中保留的每个对象都将有本人的随机对称密钥 S。数据用对称密钥 S 进行 AES-GCM 加密,S 用全局 RSA 密钥 M 进行加密,RSA 密钥应用用户指定的口令进行加密。 数据加密的具体过程如下: 在写入对象存储之前,数据块会应用 LZ4 或 ZStandard 进行压缩。为每个块生成一个随机的 256 位对称密钥 S 和一个随机种子 N。基于 AES-GCM 应用 S 和 N 对每个块进行加密。应用 RSA 密钥 M 对对称密钥 S 进行加密失去密文 K 。将加密后的数据、密文 K 和随机种子 N 组合成对象,而后写入对象存储。数据解密的步骤如下: ...

December 23, 2021 · 1 min · jiezi

关于云存储:JuiceFS-缓存策略详解

对于一个由对象存储和数据库组合驱动的文件系统,缓存是本地客户端与远端服务之间高效交互的重要纽带。读写的数据能够提前或者异步载入缓存,再由客户端在后盾与远端服务交互执行异步上传或预取数据。相比间接与远端服务交互,采纳缓存技术能够大大降低存储操作的延时并进步数据吞吐量。 数据一致性JuiceFS 提供「敞开再关上(close-to-open)」一致性保障,即当两个及以上客户端同时读写雷同的文件时,客户端 A 的批改在客户端 B 不肯定能立刻看到。然而,一旦这个文件在客户端 A 写入实现并敞开,之后在任何一个客户端从新关上该文件都能够保障能拜访到最新写入的数据,不管是否在同一个节点。 「敞开再关上」是 JuiceFS 提供的最低限度一致性保障,在某些状况下可能也不须要从新关上文件能力拜访到最新写入的数据。例如多个应用程序应用同一个 JuiceFS 客户端拜访雷同的文件(文件变更立刻可见),或者在不同节点上通过 tail -f 命令查看最新数据。 元数据缓存JuiceFS 反对在内核和客户端内存(即 JuiceFS 过程)中缓存元数据以晋升元数据的拜访性能。 内核元数据缓存内核中能够缓存三种元数据:属性(attribute)、文件项(entry)和目录项(direntry),能够通过以下挂载参数管制缓存工夫: --attr-cache value 属性缓存时长,单位秒 (默认值: 1)--entry-cache value 文件项缓存时长,单位秒 (默认值: 1)--dir-entry-cache value 目录项缓存时长,单位秒 (默认值: 1)JuiceFS 默认会在内核中缓存属性、文件项和目录项,缓存时长 1 秒,以进步 lookup 和 getattr 的性能。当多个节点的客户端同时应用同一个文件系统时,内核中缓存的元数据只能通过工夫生效。也就是说,极其状况下可能呈现节点 A 批改了某个文件的元数据(如 chown),通过节点 B 拜访未能立刻看到更新的状况。当然,等缓存过期后,所有节点最终都能看到 A 所做的批改。 客户端内存元数据缓存留神:此个性须要应用 0.15.0 及以上版本的 JuiceFS。JuiceFS 客户端在 open() 操作即关上一个文件时,其文件属性(attribute)会被主动缓存在客户端内存中。如果在挂载文件系统时设置了 --open-cache 选项且值大于 0,只有缓存尚未超时生效,随后执行的 getattr() 和 open() 操作会从内存缓存中立刻返回后果。 执行 read() 操作即读取一个文件时,文件的 chunk 和 slice 信息会被主动缓存在客户端内存。在缓存有效期内,再次读取 chunk 会从内存缓存中立刻返回 slice 信息。 ...

December 16, 2021 · 2 min · jiezi

关于云存储:如何利用-JuiceFS-的性能工具做文件系统分析和调优

JuiceFS 是一款面向云原生环境设计的高性能 POSIX 文件系统,在 AGPL v3.0 开源协定下公布。作为一个云上的分布式文件系统,任何存入 JuiceFS 的数据都会依照肯定规定拆分成数据块存入对象存储(如 Amazon S3),绝对应的元数据则长久化在独立的数据库中。这种构造决定了 JuiceFS 的存储空间能够依据数据量弹性伸缩,牢靠地存储大规模的数据,同时反对在多主机之间共享挂载,实现跨云跨地区的数据共享和迁徙。 从 v0.13 公布以来, JuiceFS 新增了多项与性能监测和剖析相干的性能,从某种程度上说,开发团队心愿 JuiceFS 既能提供大规模分布式计算场景下的杰出性能,也能宽泛地笼罩更多日常的应用场景。 本文咱们从单机利用动手,看依赖单机文件系统的利用是否也能够用在 JuiceFS 之上,并剖析它们的拜访特点进行针对性的调优。 测试环境接下来的测试咱们会在同一台亚马逊云服务器上进行,配置状况如下: 服务器配置:Amazon c5d.xlarge: 4 vCPUs, 8 GiB 内存, 10 Gigabit 网络, 100 GB SSDJuiceFS:应用本地自建的 Redis 作为元数据引擎,对象存储应用与服务器雷同区域的 S3。EXT4:间接在本地 SSD 上创立数据样本:应用 Redis 的源代码作为测试样本测试项目一:Git罕用的 git 系列命令有 clone、status、add、diff 等,其中 clone 与编译操作相似,都波及到大量小文件写。这里咱们次要测试 status 命令。 别离将代码克隆到本地的 EXT4 和 JuiceFS,而后执行 git status 命令的耗时状况如下: Ext4:0m0.005sJuiceFS:0m0.091s可见,耗时呈现了数量级的差别。如果单从测试环境的样本来说,这样的性能差别微不足道,用户简直是觉察不到的。但如果应用规模更大的代码仓库时,二者的性能差距就会逐步浮现。例如,假如两者耗时都乘以 100 倍,本地文件系统须要约 0.5s,尚在可承受范畴内;但 JuiceFS 会须要约 9.1s,用户已能感觉到显著的提早。为搞清楚次要的耗时点,咱们能够应用 JuiceFS 客户端提供的 profile 工具: ...

November 25, 2021 · 1 min · jiezi

关于云存储:腾讯云存储网关提供混合云存储服务实现数据分层存储

存储网关(Cloud Storage Gateway,CSG)是腾讯云提供的混合云存储服务。您能够通过 CSG 应用规范文件共享协定拜访位于对象存储 COS 中的数据,无缝接入私有云,实现数据的实时共享和冷热分层。腾讯云 CSG 能够依据您的业务需要灵便地部署在云上或者本地,让您更轻松地进行数据的云上解决、备份归档以及劫难复原。 腾讯云 CSG 旨在让您更加专一于自有业务的倒退,而不受存储技术门槛以及老本的困扰。 产品性能01协定转换 存储网关里的文件与COS存储桶里的对象成映射关系,反对将本地业务零碎的NFS/SMB协定读写成为HTTP/HTTPS协定,在异步将数据以原始格局上传COS。对于曾经部署基础设施的企业来说,接入私有云不再须要扭转现有网络结构,也无需开发对齐网络程序的接口,应用 CSG 即可接入私有云,享受海量云端存储的高价及弹性。 02文件共享 用户将 RESTful API 的私有云存储作为 NFS 文件系统间接挂载到本地网络中,即可通过简略的拖拽来实现文件的上传和共享。 03分级存储 本地盘存储缓存热点数据,全量数据存储在 COS 上 ,更能够利用生命周期进行沉降以降低成本。 04拜访减速 CSG 通过缓存优化算法,将常常拜访的热数据存储到本地,用户或程序可享受本地磁盘和网络的性能,相比间接应用 COS,您能够更迅速地获取罕用数据;同时,本地仅需提供缓存所需存储空间,您能够更无效地节俭在基础设施和经营保护上投入的老本。 05弹性扩容 在网关运行中,可通过磁盘配置减少元数据盘或缓存盘,且扩容工夫短,分钟级,扩容保障数据不失落,扩容后能拜访存量数据。在您业务量突增的状况下,保障业务的可持续性。 06反向同步 CSG 能够感知对应存储桶中的数据变动,所有新上传的到 COS 存储桶中的都能够通过 CSG 间接读取。对于挂载门路雷同的文件系统之间无需额定操作,即可实现数据的散发共享。 07多网关协同 可用多个网关向同一存储桶内写入数据,减速上传。 08劫难复原 CSG采纳存量设计,不长久存储任何数据,当某地业务及网关机器因故障受损时,您能够再部署一个新的网关来复原已存储至 COS 存储桶中数据的目录构造,并从新挂载到其余业务机器上,保障您自有业务的高可用性。 09网络资源配调 CSG 反对限度自定义时间段的上传/下载速率,实现数据的定时上传,帮忙您更充沛地利用进口带宽资源,或防止贵重专线资源被无序抢占,节约数据传输老本。 10控制台操作治理 CSG采纳黑盒子设计,治理和管制面在腾讯云、不在本地,且不反对离线部署和运行,躲避误操作、病毒、歹意攻打等。简化零碎设计,关注外围需要,晋升零碎健壮性和稳定性、保障数据安全。 产品劣势01无缝连接 CSG反对 NAS 协定读写腾讯云对象存储COS,用户既能够通过网关读写文件,也能够通过COS的API/SDK读写文件,利用腾讯云丰盛生态进行数据散发及智能解决(如鉴黄、涉爆等)。 02高健壮性 11’9的数据长久度,采纳无状态设计、存量设计、黑匣子设计(记录CSG缓存减速但未写入COS的数据)、3正本和纠删码技术,保障用户数据的健壮性,在极其状况下用户数据不会失落。 03安全可靠 SLA 99.95%、反对弹性扩容保障您业务的可持续性;采纳黑盒子设计和CAM拜访治理保障您数据的平安。 04方便快捷 CSG即装即用且反对腾讯云一键式部署,您无需二次开发,也无需新增机架空间、供电或冷却等设施;应用控制台操作治理简化零碎设计,更加直观便捷。 05海量存储 CSG 可能配合私有云对象存储 COS 提供海量的数据存储,单个文件系统最大反对1PB。同时,通过缓存机制,实现冷热数据拆散,将常常读取的热数据缓存在本地,而较冷数据则保留至云端,这样,您既能够享受本地磁盘带来的拜访性能,又能够同时领有云端近乎有限的存储能力。 ...

July 29, 2021 · 1 min · jiezi

关于云存储:玩转容器存储QoS

IT架构的一个发展趋势和技术挑战,就是如何将越来越多的利用运行在灵便、可扩大的对立平台上,同时还必须晋升治理和运行的效率。泛滥的利用运行在同一个资源池中的模式,和以往各个利用具备各自独立的物理计算+存储资源的运行模式有着很大的不同。其中一点不同就是,在以往的IT架构中,各个利用所需的存储容量、性能都是依据其须要独立配置的,很少存在资源抢占的问题。而当泛滥利用运行在同一个平台上时,不同利用对存储资源的性能存在抢占的危险,如何对之进行管制和躲避,就是存储的QoS(Quality of Service)管制。 那么QoS具体指的是什么?为什么它对业务如此重要? QoS是为了提供稳固的性能保障QoS对企业或者服务运营商来说是一个至关重要的技术,尤其对那些须要为下层业务提供继续稳固的存储性能的场景而言更是如此。当大量利用共享无限的资源,QoS能帮忙系统控制各个利用如何应用这些资源,最重要的是,能限度并防止那些高耗费或者运行异样的程存储QoS包含业务对存储所需的IOPS、带宽等性能的治理和管制。如果没有存储QoS,系统管理员就无奈对各个利用对存储的性能耗费进行治理,高耗费的利用可能抢占大量的存储性能,而让其它利用“活活饿死”。传统IT架构在QoS的问题上并没有那么急切,因为在传统架构中,大多的利用零碎都是独占本人的一套存储。云、容器时代的到来,把QoS推到了不得不器重的高度,因为大量虚拟机、容器都须要共享同一套存储资源。 存储QoS能用于缓解、管制并打消对存储资源性能的抢占,为零碎提供一个存储性能可预测、可管制、可治理的运行环境。 那么,容器平台长久化存储的QoS呢?既然QoS如此重要,并且在SDS和以虚拟机为核心的IaaS平台中,存储的QoS曾经成为标配性能,那么在大行其道的容器平台上,QoS管制是什么情况呢? 十分遗憾,容器编排霸主K8S目前只是反对了对CPU、内存这两个计算资源的QoS管制,还不反对对长久化存储进行QoS设置。 对于如此重要的需要焱融云当然不会束之高阁,咱们依据理论利用场景及客户诉求,对QoS性能进行了深刻开发。 K8S如何集成焱融高性能容器存储的QoS性能?装置了焱融高性能容器存储以及插件后,要创立含有QoS性能的Persistent Volume只需一步(以FlexVolume插件形式为例),在创立PV的yaml文件中加上对这个PV的IOPS(或带宽BW)的设置即可,如下图红框中所示: 随后执行K8S创立PV的命令,即可创立带有QoS限度的长久化存储,通过焱融高性能存储提供的工具,即可查问所有QoS设置,如下图所示: 成果如何,一试便知,下图别离对QoS和带宽(BW)进行了测试,容器中的长久化存储IOPS和带宽被牢牢限度在用户设定的阈值: IOPS 带宽 更多黑科技容器长久化存储QoS管制的终极目标,是帮忙容器平台向着更高效、集成度更高、性能高强的演进,进一步升高平台运维团队管理负担,晋升业务可用性。QoS只是焱融高性能容器存储泛滥杀手锏中的一个,焱融云从未停下翻新的脚步。更多的黑科技,待咱们后续一一贯您道来。

June 3, 2021 · 1 min · jiezi

关于云存储:一图回顾2021腾讯云存储新品发布会

数据成就商业价值,存储助力快人一步! 5月10号召开的腾讯云存储新品发布会已圆满结束,上面咱们一起回顾下,本次发布会的精彩内容。

May 13, 2021 · 1 min · jiezi

关于云存储:备份场景全覆盖腾讯云备份一体机-B2000给您全方位保护

TStor 是腾讯云面向混合云场景打造的存储一体机产品系列。继年初公布对象存储一体机之后,该产品系列再添新成员:TStor B2000,是面向混合云备份场景的一体机产品。 依据权威咨询机构 IDC 和 Gartner 的预测,将来大部分企业的 IT 基础设施将基于混合云架构来构建,企业的利用和数据在云上云下同时存在,数据管理、数据保护和容灾更为简单,因而对数据保护产品提出了新的要求: 兼容公有云和私有云环境,做到云上云下灾备对立治理具备高可扩展性,应答数据的海量增长安全可靠,保证数据的安全性和备份业务的连续性TStor B2000备份一体机,是一款基于混合云架构打造的,安全可靠、云边协同、开箱即用的数据保护平台。作为企业级数据安全爱护治理平台,反对对业务零碎的定时和实时备份、异地容灾、间断数据保护等性能,实用于操作系统、数据库、文件、虚拟机、云平台等利用,无效实现对业务零碎的全方位爱护。该产品的架构如下图所示: 性能个性TStor B2000备份一体机的性能个性异样丰盛,能够笼罩各类企业应用备份需要: 多场景:面向传统数据中心、云计算、大数据三大场景,笼罩操作系统、数据库、文件、虚拟机、云平台等利用; 全方位:提供全生命周期的数据保护计划; 精细化:MySQL 数据库的热备份、Informix 数据库的热备份、Exchange 单邮件复原、Oracle事务级精准的复原和撤销等; 高效化:间断日志备份,RPO 趋近于0,根本不占用业务系统资源,帮忙用户实现更高效的数据保护。另外联合高效数据压缩和重删技术,极大地节俭了备份数据传输和存储老本; 除了丰盛的备份性能外,TStor B2000备份一体机还提供了弱小的云边协同性能,实用于公有云、私有云与混合云等多种企业IT架构,一套备份零碎即可同时治理云上云下的数据。 利用场景TStor B2000反对如下场景: 本地备份:将本地业务数据备份至备份一体机,是典型的传统IT架构下的备份场景。 备份上云:本地业务的利用数据备份上云,实现数据异地备份及归档。 云上备份:应用备份一体机将私有云上的业务数据备份至云存储。 本地复原:将备份一体机或者云存储中的数据恢复至本地。 云上复原:本地数据中心故障后,应用云上资源搭建业务零碎并复原数据。 一个典型的混合云场景下的备份计划,就是上述5种场景的组合,既有本地业务数据的备份与复原,也有云上业务的备份与复原,同时数据能够在云上云下流动,其架构如下图所示: 为了最大水平保障备份数据的可靠性和备份业务的可用性,TStor B2000反对集群部署模式,由多个节点协同工作,数据跨节点冗余散布。在多个节点同时故障的状况下,备份数据仍然不会失落。另外,备份软件应用双机主备模式部署,主节点故障后,备节点主动拉起,接管主节点的备份业务,持续对外提供备份服务,保障了备份业务的连续性。 各型号比照目前,TStor B2000备份一体机应用软硬一体的形式交付,开箱即用,提供图形化界面方便管理。产品有四种规格,分为单机版与集群版。单机版实用于中小规模的备份场景,性价比高。集群版实用于中大规模场景,具备高性能、高牢靠、横向扩大的能力。四种型号的具体规格如下表所示: 在企业向混合云架构转型的过程中,TStor B2000备份一体机以其安全可靠的架构,丰盛全面的个性,简略易用的设计,以及混合云场景下弱小的云边协同的性能,成为企业建设灾备计划的最佳抉择。

May 12, 2021 · 1 min · jiezi

关于云存储:2021腾讯云存储即将召开新品发布会

5月10日 14:00-17:00,腾讯云将于北京召开2021年腾讯云存储新品发布会。发布会采纳线上+线下联合的模式,邀请全国顶级媒体现场观摩,上千家行业客户线上观看直播。 本次在发布会上亮相的3款新品,均领有行业内No.1的性能,别离是: 1、对象存储 COS:三级加速器 - GooseFS+元数据减速+COS 加速器;2、云硬盘 CBS:极速型云硬盘 IOPS 200W,时延60us;3、文件存储 CFS:Turbo 文件系统,吞吐数百GB/s 为验证3款新品的高性能,发布会还安顿了新产品现场测试流程,实在体验新品低时延、高吞吐、高并发等性能。 此外,邀请了 B 站、虎牙、金山、IBM 等知名企业的重量级嘉宾,向宽广的开发者和技术爱好者们,分享前沿技术、实战经验、开源生态和产品技术革新。 新品发布会官网报名通道: 报名链接:https://cloud.tencent.com/act...直播链接:https://cloud.tencent.com/dev...

April 29, 2021 · 1 min · jiezi

关于对象存储:RTMP协议推流助力视频数据轻松上云

近年来,在安全城市、雪亮工程、智安小区等政策的搀扶下,视频监控逐步成为市场的新增长点。而云计算、大数据、智能AI等技术,也为视频监控畛域的技术晋升、智能化改革提供了弱小的反对。 视频监控数据个别存储在本地的NVR设施中,这些设施可能散布在全国各地不同城市的机房中,企业须要对这些设施进行运维和管控,比方设施须要培修、过保替换等等。同时企业可能须要对这些视频数据做剖析解决,或者引入一些AI的能力,这些对企业来说都存在挑战。 当初,腾讯云对象存储COS推出RTMP协定推流性能,能够间接将网络摄像机的视频数据上传到COS上,无需购买NVR等存储设备,即可轻松实现视频监控数据上云。 RTMP(Real-Time Messaging Protocol,实时音讯协定)最后是由Macromedia开发的专有协定,该协定基于TCP,可保护长久网络连接并容许低提早通信,用于在Flash播放器和服务器之间通过Internet流式传输音频、视频和数据。尽管Flash已走到止境,但RTMP协定依然被宽泛应用,许多公司应用RTMP协定将实时流传输到其媒体服务器,而后对其进行转码以散发到各种播放器和设施。 业务架构 客户端摄像头须要反对RTMP推流协定,通过公网网络将视频数据推送至COS RTMP服务器,COS RTMP服务器依据用户推流通道配置,对数据进行分片,并将分片数据上传至COS存储桶。之后能够依据用户配置,触发对应的媒体解决能力。 业务场景人体人脸识别:反对人脸识别,人体检测及追踪,表情辨认,年龄检测等性能,可用于智慧社区、商场超市等场景。 2. 内容辨认:反对图像标签,挪动物体检测,宠物辨认,车辆辨认,可用于家具监控等场景。 3. 视频及图片解决:反对视频转码、视频截帧、视频转动图和智能封面,反对对图片的各种解决。 COS RTMP协定推流性能劣势通过COS RTMP协定推流性能,视频数据能够间接上云,不须要本地转储,也不须要本地做视频解码等重CPU操作,可能无缝对接COS丰盛的图像、音视频解决性能。从而节俭本地存储老本、计算资源和运维工夫、人力,且COS的存储老本相比自购NVR和存储设备老本更低,再配置COS生命周期治理实现主动沉降或删除过期数据,能够进一步升高存储老本。如果客户须要AI解决能力,能够依据用户的需要进行算法定制,客户有任何新的需要,能够很快实际并上线。 操作指引通过以下几个步骤,用户就能够应用COS RTMP协定推流性能: 在cos控制台创立存储桶,并获取密钥。具体步骤能够参考:https://cloud.tencent.com/doc...应用cos sdk创立推流通道,获取带签名的推流url。以Python sdk为例:conf = CosConfig(Region=REGION, SecretId=SECRET_ID, SecretKey=SECRET_KEY,)client = CosS3Client(conf, retry=3)livechannel_config = {'Description': 'test channel', 'Switch': 'Enabled', 'Target': {'Type': 'HLS', 'FragDuration': '2', 'FragCount': '5', }}client.put_live_channel(Bucket = test_bucket, ChannelName = channel_name, LiveChannelConfiguration = livechannel_config)推流url与观流url相似如下格局: 'PlayUrls': {'Url': 'http://bucket-appid.cos.ap-guangzhou.myqcloud.com/test-ch-1/playlist.m3u8'}, 'PublishUrls': {'Url': 'rtmp://bucket-appid.cos.ap-guangzhou.myqcloud.com/live/test-ch-1?q-sign-algorithm=sha1&q-ak=xxx&q-sign-time=xxx;xxx&q-key-time=xxx;xxx&q-signature=xxx'}3.将推流url配置到摄像头,即可将视频数据推送至COS。 总结国民安防意识的进步和政策的大力支持,带来了视频监控市场的增长,为满足企业智能化视频监控的需要,COS推出RTMP协定推流性能,可广泛应用于医疗卫生、生产平安、交通安全、物流运输等行业。后续,COS会持续深耕视频监控畛域,推出更多视频监控翻新技术和解决方案,敬请期待。 对于咱们云+社区「腾讯云存储团队」主页,涵盖了腾讯云存储团队最新动静、团队信息、产品矩阵、技术文档、视频教程等,欢送关注或留言,给出您的贵重倡议。

March 22, 2021 · 1 min · jiezi

关于对象存储:三级加速打造高性能云原生数据湖

日前,腾讯云专家工程师严俊明老师,在云+社区技术沙龙「云原生」专场,分享了基于对象存储的云原生数据湖最新技术冲破,包含云原生数据湖业务场景以及技术架构。 上面,让咱们一起回顾下严老师的精彩演讲内容。 一、大数据存储云原生趋势解析 第一阶段:存储一体,孤岛。十几年前,网络速度远低于本地磁盘吞吐速度的时候,本地化读取数据能够换取更高的吞吐性能。但随着网络速度一直放慢,磁盘吞吐速度逐步成为计算瓶颈,本地盘HDFS压力加大,运维老本升高,可网络带宽资源却闲置,导致业务效率低下。 第二阶段:存算拆散,存储、计算解耦。 解耦计算和存储负载,零碎负载平衡调度更加灵便,零碎的资源利用率进步,节约老本,能够满足业务快速增长的需要。 第三阶段:数据湖,存储对立。随着业务多样化倒退,业务间数据共享变得艰难,而数据湖是一个集中式存储池,反对多种数据源,无缝对接各种计算剖析和机器学习平台,实现数据处理与剖析,突破数据孤岛。 第四阶段:云原生,计算对立。随着数据湖计算节点调度效率升高,云原生技术能构建和运行可弹性扩大的利用,跨多云构建微服务,继续交付部署业务生产零碎。 二、对象存储架构及数据湖场景挑战 对象存储 COS 是腾讯云提供的一种存储海量文件的分布式存储服务,具备高扩展性、低成本、高牢靠、高可用、EB级扩大能力。通过控制台、API、SDK 和工具等多样化形式,用户可简略、疾速地接入 COS,进行多格式文件的上传、下载和治理,实现海量数据存储和治理。 相比传统分布式存储系统,COS 采纳超大规模分布式存储引擎:YottaStore,可轻松操控百万级超大规模存储集群。YottaStore冲破了单点Master的瓶颈,做到单集群可达百万节点的管制,且不须要拆分元数据。同时,元数据能存得更小,治理得更多,1Byte元数据能够治理2GB的物理空间。 此外,YottaStore是原生多AZ,在资源管理、调度思考AZ,所有服务器独特承当吞吐,对数据一致性有人造的保障。加上分钟级RTO,RPO为0,能够彻底解放下层业务,数据冗余度低,存储老本大幅度缩小。 为了反对以 COS 为核心的大数据存算拆散架构以及云端数据湖,Apache Hadoop-3.3.0公布了COSN文件系统,兼容HCFS接口,全笼罩HDFS大数据计算利用。 而数据湖场景面临的次要有3点: 元数据延时高元数据非原子性带宽需要大、老本高三、对象存储数据湖三级减速 1. 元数据减速技术(用户侧) 文件组织以文件树模式治理,文件拆成块治理,块又会进一步拆解存储到对象存储 COS 上,是一种扁平化构造。反对目录级别并发,分区可扩大,也可跨分区。 减速读操作,尽可能内存化,从内存间接读取数据。 2. 缓存减速技术 元数据缓存到计算端(用户侧),提前预热数据,从本地间接读取,缩小网络带宽限度,进步拜访性能。 进步缓存命中率,进步资源利用率,极大升高网络带宽老本。 反对云原生部署,部署形式灵便 3. AZ数据减速技术——COS加速器(存储端) AZ Locality专有减速域名拜访资源;缓存数据强统一;能够减速Bucket,或者prefix;同一个Bucket,反对多个加速器反对存量Bucket,随时Enable/Disable;如果miss cache,从COS回源四、EMR On COS 存算拆散实际分享Hive On COS 存算拆散优化实际 hive的例子本来是存算一体架构,数据含有大量的本地化策略、逻辑。可数据上传到 COS 后,不再含有本地逻辑,会从新计算、切分数据大小,map从274个缩小到5个,从而进步零碎并发,升高零碎运行工夫。 Spark On COS 存算拆散优化实际 spark采纳串行、单线程操作,网路延时过大。存算拆散实际对spark进行并发减速,放慢单线程操作工夫,从而进步spark的运行速度。 以上是严老师分享内容的简要概括,更多精彩内容,能够点击下方视频观看。https://www.qq.com/video/w323... 对于咱们云+社区「腾讯云存储团队」主页,涵盖了腾讯云存储团队最新动静、团队信息、产品矩阵、技术文档、视频教程等,欢送关注或留言,给出您的贵重倡议。

March 18, 2021 · 1 min · jiezi

关于云存储:腾讯云发布存储一体机TStor打通全面上云最后一公里

随着云计算、大数据、人工智能等技术的倒退,各行各业减速数据化转型,数据容量以前所未有的速度增长,本地存储难以适应数据的指数式增长。 另一方面,私有云因其易扩大、低成本、平安稳固的特点,逐步被企业广泛应用。但出于性能效率、数据私密、法规要求、老本治理等方面的思考,如何在不扭转原有 IT 架构的状况下,以较低的老本平滑向云架构演进,是每个企业面临的重大挑战。因而,混合云存储模式应运而生,既能晋升拜访效率,又能充分利用云带来的劣势,帮忙传统企业客户轻松实现数据在本地数据中心和私有云之间的无缝流动。 近日,腾讯云正式公布面向混合云存储场景的存储一体机产品 TStor,旨在帮忙客户升高企业存储数据的老本,通过灵便、经济、高效的形式,治理呈指数级增长的业务数据,实现数字化转型。 TStor 云个性云复制:TStor 和私有云存储均保留一份残缺数据,实现异地灾备/互联网拜访;云缓存:TStor 缓存热数据,私有云存储保留残缺数据,实现减速本地利用;云分层:TStor 和私有云存储之间数据分层,实现灵便数据管理。TStor 硬件能力TStor 对象存储的存储节点应用通用的 X86 服务器,硬件规格如下: 机柜应用腾讯云 mini 机柜,内置供电模组、制冷模组、UPS 电池模组、监控模组等,机柜外部构建了残缺的运行环境,对外部装置环境无要求,无需业余机房环境,实用于办公室、走道、仓库等多种场地。具体规格如下: TStor 软件能力 TStor 一体机基于先进分布式架构设计,具备智能监控、智能预警等丰盛保障机制,以及节点冗余、硬盘冗余、细粒度重构等欠缺保障体系,极大地晋升了数据可靠性。TStor 基于凋谢硬件平台,分布式架构,提供无目录层次结构、无数据格式限度,齐全兼容 S3 接口,可包容海量数据且反对 HTTP/HTTPS 协定拜访的对象存储产品。并且 TStor 提供了用户敌对的 Web UI 控制台,用户能够在图形化界面上实现简直所有的治理和运维操作。 TStor 一体机在腾讯外部已有数年的应用和运维教训,存储数据量达数百个 PB,承载多个重要业务零碎,曾经被证实是一款成熟牢靠的分布式存储产品。 本次腾讯云面向混合云存储市场,正式公布了该产品,为客户提供经济高效、安全可靠、简略易用的 PB 级海量数据存储计划,实用于边缘计算、医疗影像、备份归档、大数据分析、机器学习等各类非结构化数据存储场景。后续腾讯云还将针对混合云存储市场的各类细分场景,公布更多一体机产品,敬请期待。 对于咱们 云+社区「腾讯云存储团队」主页,涵盖了腾讯云存储团队最新动静、团队信息、产品矩阵、技术文档、视频教程等,欢送关注或留言,给出您的贵重倡议。

March 10, 2021 · 1 min · jiezi

关于云存储:使用云存储的移动应用面临风险不安全的云配置暴露数据

在挪动利用程序开发中,服务器端存储应用程序数据依然是重中之重。特地是,许多开发人员已开始应用后端 API,这些 API 可使他们的利用实时查问服务器中的信息,而不是响应存储在文件中的静态数据。 然而,因为发现许多云存储服务应用不平安的配置,因而成千上万个挪动应用程序上的数据可能会受到威逼。 挪动利用程序开发平安问题是重中之重当爱护这些服务的配置的工作落在利用开发人员而不是提供商(例如 Amazon AWS、Google 的 Firebase Storage 或 Microsoft 的 Azure)上时,就会面临一个问题。当开发人员出于爱护 API 安全性的目标而应用这些存储服务时,他们将大部分精力投入到构建应用程序中,而不是爱护存储的信息。这种忽略可能威逼到许多应用程序开发人员以及企业和用户。 挪动平安公司 Zimperium 于 2021 年发现,应用云存储的挪动利用中有 14% 以上因配置不平安而面临危险。这项钻研表明,在寰球和所有行业中,各种应用程序都容易受到公开可辨认信息(PII),欺诈和不受监管的外部IP /配置共享的威逼。 因为这些挪动应用程序的安全性偏向于依据云提供商的默认设置进行回复,因而开发人员甚至可能没有意识到可能会产生数据泄露。实际上,即便云提供商为开发人员提供了平安指南,开发人员也可能不会恪守它们。 裸露于 PII 后,各种模式的集体医疗数据、游戏应用程序、社交媒体应用程序和健身应用程序都将面临危险。此类裸露使攻击者能够拜访挪动电子商务平台上的用户数据、交通利用以及挪动钱包的付款信息。最初,整个 IP 和零碎面临着支流音乐利用、支流新闻服务、财产 500 强软件公司、支流机场和支流硬件开发商的歹意数据篡改的威逼。 挪动应用程序安全性的挑战次要是开发者本人总体而言,受不平安云服务器配置影响最大的是商业,危险为 17.6% 。为了加重此类危险,开发人员能够首先确保内部烦扰无法访问他们正在应用的云存储数据库。此外,开发人员能够确定平安软件开发生命周期的优先级,以避免执行未过滤的代码。 归根结底,挪动应用程序安全性的挑战依然次要在于应用程序开发人员自身。只管某些组织可能会防止进行更宽泛的更改,例如打补丁常开零碎或更换易受攻击的硬件,但仅应用程序创建者就能够帮忙避免许多威逼。一旦更多的开发人员承当起这一责任,爱护挪动应用程序就能够成为一种标准,而不是预先的想法。

March 10, 2021 · 1 min · jiezi

关于云存储:云端大数据分布式文件系统-成本优化秘笈

一、CHDFS 介绍CHDFS(云 HDFS)是腾讯云一种提供规范 HDFS 拜访协定和分层命名空间的高性能分布式文件系统,次要解决大数据场景下海量数据存储和数据分析,为实现计算与存储拆散提供解决方案。 CHDFS 着重于分布式元数据服务,数据存储依赖对象存储 COS。COS 作为云端根底存储服务,为 CHDFS 提供了松软的数据底座,不仅反对海量数据存储和超大带宽,还反对多 AZ 模式,且默认 EC 编码,老本更低,同时通过冷热数据智能分层,进一步升高存储老本。 二、生命周期治理随着时间推移,CHDFS 上数据一直累积,但只有小局部是用户最近应用的,大部分是历史数据,拜访频次逐步缩小,如日志文件,数据备份等。 如果用户不去治理这些数据,那么存储费用逐步增大,对用户本身业务倒退也不敌对,但被动治理须要投入人力和工夫老本,费时费力,因而 CHDFS 对齐 COS 数据分层能力,推出生命周期性能,帮忙用户更加便捷地治理冷热数据。 用户能够通过配置 CHDFS 生命周期规定,定期将数据文件从规范存储降为归档存储或者间接删除,整个沉降和删除过程由 CHDFS 生命周期性能自动化实现,保障及时精确,且不产生任何附加费用,同时反对回热操作,用于对曾经降为归档存储类型的数据文件从新发动拜访。 三、生命周期规定生命周期规定即生命周期策略,须要用户指定以下参数: Path:生命周期规定指标门路。 指定目录:规定作用于目录下的所有文件,包含递归子目录下的文件。指定文件:规定只作用于具体文件。Type:生命周期规定类型。 沉降:定期将文件存储类型从规范存储降为归档存储,节省成本。删除:定期将文件间接删除。Days:指定生命周期规定在文件最初拜访工夫的多少天后触发相应的操作。阐明:与 COS 对象最初批改工夫 mtime 不同,CHDFS 满足文件系统语义,不仅反对文件最初批改工夫 mtime、元数据最初批改工夫 ctime,还可能反对以文件最初拜访工夫 atime 作为分层条件,这种策略更能满足用户需要。 四、回热工作回热的目标是为了对曾经沉降的文件从新发动拜访,它会复制一份规范存储的文件正本供用户读取,正本到期后会主动删除,在此期间归档存储的文件始终存在,创立回热工作须要用户指定参数: FilePath:回热文件门路。Type:回热类型。依据回热工夫长短,回热分为三类。 极速模式:回热工作在 1 - 5 分钟内可实现。规范模式:回热工作在 3 - 5 小时内实现 。批量模式:回热工作在 5 - 12 小时内实现。Days:回热实现后,规范存储的文件正本的保留天数。阐明:CHDFS 对于数据沉降、删除和回热,须要依赖 COS 对外提供的标准接口,所以生命周期在应用形式上与 COS 类似。 五、应用形式用户能够通过控制台和云 API 来配置生命周期规定,创立回热工作仅反对云 API。 1、控制台进入 CHDFS 控制台,抉择具体文件系统,进入生命周期配置页,增加规定,实现生命周期配置,如下图所示: ...

February 26, 2021 · 1 min · jiezi

关于云存储:迁移到Spark-Operator和S3的4个集成步骤

2020年CNCF中国云原生考察 10人将获赠CNCF商店$100美元礼券! 你填了吗? 问卷链接(https://www.wjx.cn/jq/9714648...) 客座文章作者:万事达卡首席软件开发工程师Allison Richardet 在万事达,外部云团队保护咱们的Kubernetes平台。咱们的工作包含保护Kubernetes集群,这是咱们所依赖的外围部署,并为租户提供了日志、监控等服务,并为租户提供了良好的体验。 咱们的租户之一,数据仓库团队,已经在YARN和HDFS上应用过原生Apache Spark。他们找了咱们的团队,心愿将他们的大数据工作转移到Kubernetes;他们想要实现云原生化,而咱们也有机会在Kubernetes上与Apache Spark单干。 所以,咱们的旅程从Spark Operator开始。向Kubernetes和Operators的迁徙将为咱们的外部客户数据仓库团队关上云原生的可能性。咱们有机会帮忙他们利用可伸缩性和老本改良的劣势,而切换到S3将进一步实现这些指标。 背景操作器(operator)是什么,为什么咱们,或者你,对此感兴趣?首先,操作器应用自定义资源扩大了Kubernetes API。操作器还定义了一个自定义控制器来监督其资源类型。将自定义资源与自定义控制器联合在一起会产生一个申明性API,在这个API中,操作器会协调集群申明状态与理论状态之间的差别。换句话说,操作器解决与其资源相干的自动化。 有了这些益处,咱们的团队很快乐可能利用Kubernetes的Spark操作器来反对咱们的租户。通常,原生Apache Spark应用HDFS。然而,迁徙到云端并在Kuberentes上运行Spark操作器,S3是HDFS的一个很好的代替计划,因为它具备老本劣势,并且可能依据须要进行扩大。乏味的是,S3在默认状况下不能与Spark操作器一起应用。咱们参考了Spark操作器以及Hadoop-AWS集成文档。此外,咱们将分享以下4个步骤的详细信息:镜像更新、SparkApplication配置、S3凭据和S3款式。遵循咱们的步骤,将S3与你的Spark作业和Kubernetes的Spark操作器进行集成。 工作流程与咱们部署到Kubernetes集群的大多数应用程序一样,咱们应用Helm chart。Kubernetes的Apache Spark操作器的Helm chart能够在这里找到。 Values & Helm 模板咱们更新values.yaml,而后运行helm template生成咱们将部署到Kubernetes集群的清单。咱们发现,对将要创立的内容具备可见性和对部署的管制是值得额定步骤的;模板存储在git中,咱们的CD工具负责部署。 默认的chart values将容许你疾速启动和运行。依据你的须要,以下是你可能须要做的一些批改: 启用webhook:默认状况下,不启用Mutating Admission Webhook。启用容许自定义SparkApplication驱动程序和执行程序pod,包含挂载卷、ConfigMaps、亲和性/非亲和性等等。定义ingressUrlFormat:Spark UI可选的ingress。请参阅疾速入门指南和默认values.yaml获取更多详细信息和选项。 需要要运行应用S3的SparkApplication,须要SparkApplication的附加配置,包含一个自定义docker镜像。Hadoop S3AConnector是一种能够对S3进行读写的工具。 1. 镜像更新SparkApplication应用的docker镜像须要增加两个jar(hadoop-aws和aws-java-sdk或aws-java-sdk-bundle),版本依据Spark版本和Hadoop配置文件。 在这一步中有几件事件要记住。 用户和权限额定的Jar如果应用spark镜像作为终点,在增加jar时援用它们各自的dockerfile以正确对齐用户和地位。 让咱们来看看python Dockerfile。在执行任何装置工作之前,用户被设置为root,而后重置为${spark_uid}。 通过查看根本镜像,能够看到jar位于/opt/spark/jars或$SPARK_HOME/jars中。最初,更新jar的权限,以便可能应用它们。 上传到S3的文档提供了应用jar文件的信息;然而,咱们须要一个蕴含fs.s3a.path.style.access配置的新Hadoop版本——咱们将在前面一节中探讨这个问题。在编写本文时,咱们应用spark操作器版本v1beta2-1.2.0-3.0.0,其中蕴含根本spark版本3.0.0。应用gcr.io/spark-operator/spark-py:v3.0.0-hadoop3镜像作为终点,咱们增加了以下jar:hadoop-aws-3.1.0.jar和aws-java-sdk-bundle-1.11.271.jar。它须要一些试验来确定最终能工作的正确镜像组合。 2. SparkApplication配置SparkApplication须要额定的配置能力与S3通信。spec.sparkConf中要求的最小配置如下: sparkConf: spark.hadoop.fs.s3a。端点:<端点> spark.hadoop.fs.s3a。impl: org.apache.hadoop.fs.s3a.S3AFileSystem还必须提供拜访S3的凭据。有相似于下面的配置选项;然而,这是十分丧气的,因为它们是字符串值,因而与平安最佳实际相违反。 3. S3凭证咱们不在SparkApplication的sparkConf中提供s3凭据,而是创立一个Kubernetes机密,并为驱动程序和执行程序定义环境变量。Spark操作器文档提供了几种应用secret的选项,以及用于挂载机密或指定环境变量的残缺示例。 接下来,因为咱们应用环境变量来验证S3,咱们在sparkConf中设置以下选项: sparkConf: spark.hadoop.fs.s3a.aws.credentials.provider: com.amazonaws.auth.EnvironmentVariableCredentialsProvider这是不须要的,如果没有提供,将尝试依照以下程序来尝试凭据提供程序类: org.apache.hadoop.fs.s3a.SimpleAWSCredentialsProvidercom.amazonaws.auth.EnvironmentVariableCredentialsProvidercom.amazonaws.auth.InstanceProfileCredentialsProvider4. S3款式在SparkApplication的sparkConf中有一些其余的选项须要记住,这些选项是基于你特定的S3的: sparkConf: extraJavaOptions: -Dcom.amazonaws.services.s3.enableV4=true spark.hadoop.fs.s3a.path.style.access: “true” spark.hadoop.fs.s3a.connection.ssl.enabled: “true”门路款式拜访——通过启用门路款式拜访,将禁用虚拟主机(默认启用)。启用门路款式拜访能够打消为默认虚拟主机设置DNS的需要。 启用SSL——如果你正在应用TLS/SSL,请确保在SparkApplication的sparkConf中启用这个选项。 额定的Java选项——依据你的须要而变动。 应用S3当初你曾经实现了应用S3的所有设置,当初有两种抉择:利用S3解决依赖项或上传到S3。 S3解决依赖项mainApplicationFile和spark作业应用的附加依赖项(包含文件或jar)也能够从S3中存储和获取。它们能够在spec.deps字段中的SparkApplication中与其余依赖项一起定义。spark-submit会别离应用spec.deps.jar和spec.deps.files中指定的jar或文件。s3中拜访依赖的格局为s3a://bucket/path/to/file。 上传到S3上传到S3时,文件地位的格局为s3a://bucket/path/to/destination。bucket必须存在,否则上传失败。如果destination文件曾经存在,上载将失败。 总结咱们介绍了启动并运行Spark操作器和S3所需的4个步骤:镜像更新、SparkApplication的sparkConf中所需的选项、S3凭据以及基于特定S3的其余选项。最初,咱们给出了一些对于如何利用S3来实现依赖关系和上传到S3的倡议。 ...

January 21, 2021 · 1 min · jiezi

关于云存储:重磅宣布|强强联合腾讯云携手Veeam提供云上数据存储服务

近日获悉,腾讯云对象存储COS正式通过Veeam备份软件标准化测试,携手为用户提供云上数据存储服务。 Veeam对COS的反对是通过SOBR( Scale out backup repository)实现的,这意味着用户只有购买了COS的云存储空间,就能够通过Veeam实现近程数据备份,把数据写入COS的存储桶中,还能够在Veeam上间接拜访或删除COS的数据。 这极大地简化了数据备份和应用过程,方便快捷实现数据上云,保障用户能够实现 3-2-1-0的数据管理最佳实际(3个不同的数据正本、2种不同的介质、1个在异地、0施行备份恢复性验证后未呈现谬误),轻松实现云端备份容灾。 Veeam致力于数据管理的变革,可能为用户提供简略、灵便、牢靠且易于应用的数据管理计划,IDC把Veeam列为企业级数据存储和管理软件的领导者。 据Gartner最新公布的《2020年数据中心备份复原解决方案魔力象限》报告,Veeam已屡次处于领导者象限,执行力名列榜首。 腾讯云作为国内近年来倒退速度最快的云厂商,领有超过100万的开发者。据Gartner首次公布的《云基础设施和平台服务》报告,腾讯云是入围本次魔力象限的7家国内厂商之一。 COS能提供数据跨多架构、多设施冗余存储,为用户提供异地容灾和资源隔离性能,细粒度的数据存储形式,更有利于数据管理、用户拜访与合规。 COS还提供图形化程序、命令行工具、协定工具等多种路径对存储对象进行批量操作,还有可能将存储桶挂载到本地的工具,让用户能像应用本地文件系统一样间接操作COS。 据悉,本次COS通过的Veeam备份软件测试涵盖了物理、虚拟化平台及Office 365 SaaS备份与及时复原,数据实验室、SureBackup可靠性验证、爱护图形化报告和告警治理等多个测试场景,并对Veeam配置管理功能测试、细粒度备份复原测试、日常运维治理功能测试等多项子项性能进行测试。 测试结果表明:Veeam能够完满兼容对象存储COS,并执行Veeam上的各种备份复原操作。Veeam提供可视化界面集中管理文件系统,用户不仅能够把数据写入COS进行长期保留,还能够利用COS中的数据恢复到其余云平台介质中实现迁徙,以多种技术手段保数据的可用性、敏捷性和服务性。 数据的超增长与合规要求促使企业缩短数据保留工夫,而此次单干,能够给用户提供老本更低的可扩大数据存储解决方案。 一方面,针对数据有限增长的存储和治理问题,Veeam用横向扩大的形式链接COS,并主动分层,将数据块在不同的存储层迁徙,这样能够解决数据拜访、应用和长期保留问题。 另一方面,磁带存储须要昂扬的运维和存储老本,且存在安全性问题,如果存到云端做备份,COS能够依照拜访频次免费,无效降低成本,且云端存储有十分齐备的平安机制,多正本保障数据安全。 腾讯云相干负责人示意,和Veeam的单干对于丰盛COS的生态圈意义重大,联结拓展潜在用户,为用户提供更便捷、平安、高效的数据存储服务,是单方单干的基本诉求。 Veeam相干负责人也示意,对Veeam的用户来说,COS提供的平安稳固、海量、低提早、低成本云端存储服务,可轻松实现跨云灾备,领有极高的性价比和吸引力。联合Veeam的SOBR,能够达成客户长期数据保留的同时,保障数据恢复性能,切实地助力用户的实现数据安全。

December 28, 2020 · 1 min · jiezi

关于云存储:Yotta企业云盘提升各大行业跨部门合作效率

对于管理者来说,在不同的管理软件之间切换是一件麻烦的事件,然而当初在企业云磁盘上,解决所有事务都十分不便。因而,能够说企业云盘对企业意义重大。 技术的倒退速度远远超乎人们的设想,有谁可能在 10 年前就想到,明天的互联网已成为人们生存密不可分的一部分,生存即是如此,工作下班亦然如此。其中Yotta企业云盘就是能让员工更便捷化、更高效化的终极武器。 企业各部门之间的单干经常会受到各种工夫、空间上的限度,比方员工生病了,亦或者长期有重要事务出差,都会耽搁一段时间,少则一两天,多则更久。即便电话沟通、qq沟通也只能在短时间内口头表述,但如果还要进行跨区域传输大量的文件资源,到时则须要消耗更多工夫,既耽搁团队的工作,又耽搁本人的要紧事。 要想解决种种跨部门单干隐患,一部手机,一个简略实惠的Yotta企业云盘,就可能帮各大企业轻松做到,随时随地解决文件,进步企业各部门的合作效率,实现业绩翻倍。 Yotta —— 一个随心挪动办公桌 对于以往的企业而言,“QQ+电脑”的模式曾经成为泛滥企业文件办公的标准配置。但随着工夫的推移,企业各部门之间存在的问题也越来越多,尤其是大中型企业,如果利用QQ传送文件,一旦遇到大文件传输,必然须要漫长的期待,要是长期走开,文件忽然呈现诸如传输失败、传输停滞等景象,最终都要从新再花工夫。这种曾经过期的形式对于当初快节奏的企业来讲,未然略显蠢笨。 在现在的挪动时代,企业部门间的文件传输素来都只有在手机实现,而且无需放心速率问题,因为Yotta企业云盘就能实现大文件秒传,随时随地都能在部门间的“共享空间”里上传、下载。具备多角色权限设置和治理选项,角色不同权限不同,对于不同分公司、层级、部门、人员等文件对立归档,可设置预览、上传、下载,仅下载等不同操作权限,让企业做到在线极速上传,在线整顿部门文件,使得部门合作更高效、更有序。 Yotta——协同办公、工作进步 首先,Yotta企业云盘帮忙各大企业轻松解决了文件治理问题,它能够让企业一键对立上传所有文件材料,并对上传的文件及时进行分类分级管理,不便企业每一位员工查问。 如果云盘曾经存有海量文件,员工们还能够进行关键字搜寻,查问起来更加精准、快捷。从此,员工无需再放心因文件脱漏、失落、误删等起因,耽搁本人的工作进度,极大进步了文件的管理效率和员工的办公效率。 Yotta企业云盘——10年磨一剑——20年专一于平安 10年磨一剑——20年专一于平安:外围专利——Trupricacy 领有Trupricacy数据加密专利,即便云端管理员也无奈获取用户数据,无效避免云端隐衷泄露,反对用户数据实时备份,爱护企业数字资产。 齐备日志记录,具体保留所有用户对文档操作。保障有据可查。 云端不存储明文密钥,攻破数据库也有效; 一文一密存储,所有用户的所有文档的密钥均不雷同; 加密后仍能实现去重,节约存储空间; 加解密均在本地实现,网络上无明文流通; 企业云盘是针对企业文件治理推出的一种产品,性能十分弱小,除了简略的文件存储和上传下载等性能,治理类的共享文件、协同等性能能很好地进步企业办公效率,晋升企业治理效益。

December 18, 2020 · 1 min · jiezi

关于云存储:对象存储COS全球加速助力企业出海

近年来,中国互联网行业迅猛发展,国内宏大的市场孕育出了许多景象级的产品,也锻炼出了十分成熟的产业链。与此同时,很多海内市场还处于萌芽期,存在着微小的流量红利,越来越多的互联网企业开始减速“出海”布局,以谋求更大的发展前景,也有很多初创企业,面对国内日益强烈的竞争,抉择从海内起步,避开矛头。对于出海企业,如何在一些根底建设并不欠缺的地区,保障业务的稳固可用,始终都是业务部署最关怀的问题。 置信很多人在地铁上体验过信号时有时无的感觉,微信总是在连贯中和收取中来回横跳,至于发送的音讯,是否发送胜利就只能看运气了。而且,一段数据会通过屡次的公网转发才会到服务器端,那么试想一下,如果全网络链路都是处于这种状态的话,想要胜利的发送一段音讯,难度会有多大?而很多海内欠发达地区的根底建设,可能提供的公网环境往往不敢恭维,那企业该如何保障本身业务的可靠性呢?这个时候,腾讯云对象存储 COS 寰球减速性能就能很大水平上地为您解决这个问题。 COS 寰球减速性能如果您采纳腾讯云对象存储 COS 来部署业务,在一些网络基础设施较差的地区,通过寰球减速性能,就能够很好地保障您业务的可用性。腾讯云对象存储 COS 寰球减速性能利用全局链路的主动测速性能,智能路由解析用户申请,抉择最优网络拜访链路,实现申请的就近接入。申请会就近发送到腾讯云寰球各地的接入层,再通过腾讯云内网,将申请传送至对应的存储桶以最大水平上地进步传输性能。寰球减速性能的外围在于腾讯云遍布寰球的基础设施,通过稳固疾速的内网环境来替换不稳固的公网链路,以保障客户业务的可用性,也为客户业务的进一步扩大打下基础。 减速成果测试 利用第三方测评工具,咱们将 COS 的存储桶设置在了上海园区,应用 COS 的一般上传域名以及减速上传域名,在寰球各个拨测点进行1MB大小文件的上传测试,从上图咱们能够显著地看到一些自身上传速度较慢的地区的上传成果失去了显著的晋升。 对于中国外乡的上传晋升成果,咱们采纳某个曾经利用了寰球减速性能的 APP 进行实测,后果如下。 该 UGC APP 采样了中国西北地区的一般域名和减速域名上传接口的成功率数据,咱们能够清晰地看到,在开启寰球减速性能当前,新疆、西藏、内蒙古等地的上传成功率都维持在99%之上,相比未开启时,西北地区的上传成功率均匀进步了2%~3%,总体来看,该 APP 上的整体成功率由97%晋升到了99.5%。 如果想更多地理解腾讯云对象存储 COS 和寰球减速性能,欢送拜访咱们的产品官网文档。

December 10, 2020 · 1 min · jiezi

关于云存储:混合云存储打开的正确姿势腾讯云存储网关-CSG

近年来,随着云计算的倒退,越来越多的企业抉择将IT零碎基础设施转移到云上,上云有助于推动企业放慢信息化、数字化、智能化的转型,然而很多企业对传统的业务零碎依赖程度较高,短时间内将业务迁徙上云将会面临很多危险。 企业的业务零碎都是历经多年积攒构建,业务软件和数据通常以传统的架构来进行设计,业务向云端迁徙将导致企业业务架构大幅度扭转,整个过程耗时耗力且技术难度系数较大,存在业务危险,企业原有的IT开发和管理人员可能难以了解和适应云端业务模式。 腾讯云存储网关 CSG 能够完满的解决这个问题,企业无需改变传统的业务架构,整个上云过程对用户现有的业务简直没有任何影响,同时,用户可依据业务须要实现容量的主动扩缩容,而且对于上云后的数据,用户也能够利用对象存储 COS 欠缺丰盛的生态体系为业务赋能。 存储网关劣势1、简略易用CSG 提供协定转换机制,企业能够在不扭转原有业务架构的状况下应用 COS ,无需任何学习老本即可无缝上云。基于 COS 的云上服务,如数据处理、数据湖剖析、内容散发等,可能升高企业自有业务的部署开发难度。  2、老本最优CSG 会缓存热数据来保障本地拜访性能,同时会将全量数据保留至 COS 中以确保数据的平安持久性,企业能够通过这种冷热分层的机制以低成本享有高性能和高安全性兼备的存储服务。CSG 可能依据时段调配调度网关上传下载的带宽,在带宽资源缓和时,能够限度网关占用的带宽,免得影响自有业务;而在业务闲暇时则可放开限度,在无限的老本下,充分利用带宽资源。  3、高可用性CSG 自身不长久化存储数据,多个网关能够同时对一个存储桶创立文件系统,因而当局部网关出现异常时,能够利用其余网关持续放弃对相应存储桶的拜访。CSG 也能够针对既有存储桶创立文件系统,在极其状况下,即便所有现存网关都不能放弃服务,依然能够再部署一个新的网关来拜访对应存储桶,保障自有业务的持续性。  应用形式一、线下部署线下部署是对于传统企业最实用的部署场景,对于很多没有上云的企业,设施都在本地,大部分的拜访还是产生在本地,通过在本地部署存储网关 CSG 软件,能够同时满足线下和线上的需要。 用户利用现有的机房设备,在本地硬件服务器上部署 CSG 网关软件,用户可能持续以低提早和高带宽间接内网拜访本地服务,同时网关会主动将数据同步至腾讯云 COS 中。 二、线上部署对于曾经将局部业务迁徙至云上的用户,通过购买一体化的 CSG 存储网关,能够让数据更好的接入整个对象存储 COS 的生态中,以低成本开掘数据价值,为业务赋能。 线上部署模式,能够不便用户在不扭转业务架构的前提下,将云上业务接入海量无下限的对象存储 COS,进一步盘活云上的业务体系,扩大更大的潜在商机。 目前,对象存储 COS 曾经将存储网关 CSG 的能力集成进了控制台,用户能够在存储桶详情页应用存储网关 CSG 功能模块,非常繁难地为对应存储桶创立文件系统,同时,咱们也为新用户提供了优惠力度十分大的流动,欢送大家上线体验哦~

December 8, 2020 · 1 min · jiezi

关于云存储:Docsify腾讯云对象存储-COS一键搭建云上静态博客

最近始终在想如何利用 COS 简化动态博客的搭建过程。搜了很多的动态博客搭建过程,发现大部分的动态博客都要通过编译能力生成动态页面。功夫不负有心人,终于让我找到了一个超简洁博客的搭建办法。 成果预览http://docsify-1252452803.file.myqcloud.com/ 本文应用到工具腾讯云对象存储COSBrowser 客户端Docsify一颗可能写 markdown 的聪慧大脑 ????本文办法的长处不须要装置 node,谁都能够一键主动搭建;本地不须要全局装置 doscify;不须要保护两份代码;若在写作过程中不小心把文件全删了,还能够复原回来;一边写作一边刷新页面即可实时在线上看到后果。上面,就让我来给大家瞅瞅,我是如何做到一键搭建云上动态博客。 后期筹备工作第一步首先,你要在腾讯云对象存储控制台创立一个存储桶。这里作为例子,我创立一个名为 docsify 的存储桶。地区能够就近抉择,拜访权限要选私有读公有写。 第二步关上 COS 的动态网站性能。 第三步关上 COS 的默认 CDN 减速,源站类型抉择动态网站源站。 一键搭建博客下载 COSBrowser 客户端,用腾讯云账号登录,并进入刚刚创立的那个存储桶。 关上客户端,并点击腾讯云账号登录。进入刚刚创立的存储桶。点击上传按钮,抉择链接文件上传,并将下列 url 文件资源复制到输入框中,而后点击上传。 开始写文档上一步上传胜利后,能够看到当前目录下创立的几个文件。 vue.css 博客依赖的款式文件,不须要管docsify.min.js 博客依赖的脚本文件,不须要管index.html 博客的入口文件README.md 会做为主页内容渲染间接在 COSBrowser 客户端编辑 README.md 就能更新主页内容,当然也能够增加更多页面。 多页文档假如你存储桶的目录构造如下: 那么对应的拜访页面将是: 定制侧边栏为了取得侧边栏,您须要创立本人的_sidebar.md。您能够在 COSBrowser 新建 _sidebar.md 文件。默认状况下侧边栏会通过该文件主动生成。 首先配置 loadSidebar 选项,具体配置规定见配置项#loadSidebar。 编辑 index.html 文件: 而后编辑 _sidebar.md 文件 再刷新线上页面,即可看到侧边栏。 线上实时预览在上述操作后,间接在浏览器关上 http://docsify-1252452803.cos-website.ap-guangzhou.myqcloud.com/ 就能在线上看到文档。 留神这里可能进行实时预览的链接为动态网站拜访链接,不是减速域名链接。每次编辑完后刷新浏览器页面就能实时看到更新后的文档内容。 但如果想要更新 CDN 缓存,则须要去 CDN 控制台 对该 url 进行刷新。 常识补充1、COSBrowser 如何进行文件复原(找回历史文件)?COSBrowser 客户端编辑窗口有一个小小的【时钟】按钮,点击该按钮可关上编辑器历史。然而该性能仅帮您保留最近 100 次所有文档编辑的记录。 若须要 COS 帮您主动保留正本,则能够开启存储桶的版本控制性能。 ...

December 3, 2020 · 1 min · jiezi

关于云存储:腾讯云-CHDFS-云端大数据存算分离的基石

随着网络性能晋升,云端计算架构逐渐向存算拆散转变,AWS Aurora 率先在数据库畛域实现了这个转变,大数据计算畛域也迅速朝此方向演变。 存算拆散在云端有显著劣势,岂但能够充分发挥弹性计算的灵便,同时集中的托管存储能够提供更大的容量和更低的老本,防止了云端大量自建存储集群的保护代价。 一、问题和挑战对象存储是宽泛应用的云端非结构化数据存储解决方案,越来越多的非结构化数据汇集于对象存储的数据湖中,随之而来的是对这些海量数据的剖析需要。 然而对大数据分析的存储系统来说,HDFS 接口是事实标准,HDFS 是大数据生态的存储基石。 原生的对象存储接口不兼容 HDFS,无奈间接应用。为反对计算存储拆散的大数据场景,对象存储通常提供了一个模仿层,实现 HDFS 语义到对象存储语义的转换,典型实现相似 s3n 和 cosn。然而这类实现不足对真正的文件系统接口的反对,基于对象存储的扁平目录构造无奈实现分层命名空间,在解决相似 rename 等操作时效率极低(理论是基于前缀复制关联的所有对象),对于 list、head 等频繁元数据操作的场景提早较高,一些对象存储系统还短少强一致性语义,不能保障写后读一致性,导致下层的大数据计算框架出错。 同时在数据流方面,诸如常见的文件 append 操作,s3n 和 cosn 等对象存储的模仿层也无奈反对。 为反对大数据存算拆散场景,须要从新设计云端存储系统,该零碎能够为云端大数据计算提供高效牢靠的存储基石,在实现有限存储的同时,重点满足对元数据的需要。 为此,咱们提出了一种基于对象存储的通用分布式文件系统设计方案:cloud native hdfs,简称 CHDFS。 二、CHDFS 整体介绍CHDFS 整体架构如图所示。 CHDFS,在对象存储之上,充分发挥云端劣势,构建可扩大的 metadata 层,实现对 HDFS 语义的反对。通过高度优化的 metadata 层,能够反对海量元数据的高效拜访。在元数据规模远超 HDFS 的状况下,达到靠近原生 HDFS 性能的成果。同时提供优化了读写数据流的 java 客户端,在反对高效元数据操作的同时,充分发挥了对象存储高吞吐和低成本的长处。 CHDFS 基于对象存储实现文件系统语义,数据托管给对象存储,把对象存储当做磁盘应用,在此基础上构建文件系统分布式元数据层,反对海量数据。基于对象存储托管数据,能够主动取得对象存储的劣势,如低成本,高牢靠,大吞吐,高可用等个性,容量可达到百 PB 级别。 三、CHDFS 元数据服务特点CHDFS 元数据服务采纳分布式架构,在元数据读写方面做了较多优化,反对百亿级别的文件数据量,冲破了 hdfs namenode 规模限度,同时保障了严格的强统一语义。 比照 COS 和 HDFS,具备以下特点: 毫秒级别的原子 rename 操作,对目录和文件都实用;元数据强统一,写入后立刻可见;反对百亿级别的文件数量,远超 HDFS 规模,提早和 HDFS 相当;单文件系统,元数据反对 10w 以上的 qps,满足大规模计算的高并发需要;高可用,秒级的 ha 切换工夫;元数据并行加载,冷启动速度 比 HDFS 快1个数量级;元数据跨区域/可用区复制,进一步提高可靠性;CHDFS 提供了多种元数据引擎,在面临不同的利用场景时,用户能够有多种抉择,达到老本、容量和性能的均衡。 ...

December 1, 2020 · 1 min · jiezi

关于云存储:对象存储COS成本优化方案

随着上云企业越来越多,企业对用云老本问题也越发器重。业务的倒退会产生海量存储需要,在云端存储数据时,如何进行老本优化,加重业务累赘呢? 在进行老本优化之前,首先须要理解腾讯云对象存储COS的老本形成。对象存储的计费项次要包含存储费用、流量费用、申请费用、数据取回费用和管理费用等五大项;对于大部分客户来说,存储费用和流量费用是其云存储老本的次要组成部分。 在存储费用方面,COS提供了规范存储、低频存储、智能分层存储、归档存储、深度归档存储等不同的存储类型,各个存储类型的产品规格和价格均存在差别,客户能够依据本人的业务模式抉择性价比最匹配的存储类型。在流量费用方面,存在外网上行流量、CDN回源流量、跨地区复制流量和寰球减速流量等流量类型,业务模式的差别会导致用户流量费用的形成存在差别。比方,某客户的业务次要以电商网站为主,存在大规模图片散发,这类业务的CDN回源流量较多,因而耗费的流量费用次要以流量费用为主。上面咱们将从5个方面介绍COS老本优化计划:抉择适合的存储类型定期通过清单和拜访日志功能分析数据拜访模式通过生命周期和批量解决沉降数据通过文件压缩缩小存储容量进行老本回顾一、抉择适合的存储类型依据业务模式抉择适合的存储类型可能较大幅度地优化业务的存储老本。COS提供了丰盛多样的存储类型,客户能够依据对性能、数据持久性、业务可用性的要求,抉择不同的存储类型。规范存储的存储费用绝对较高,但提供了起码的读取提早;低频、归档、深度归档这三种存储类型的存储费用较低,然而在下载数据的时候,会额定耗费数据取回费用,并且须要耗费较久的取回工夫,因而更适宜于大量读取的数据存储。下表展现了应用不同存储类型存储一个月数据对应的存储老本,以在广州园区存储100TB业务数据为例: 从表中能够看到,如果业务数据下载量较低,则抉择归档存储甚至深度归档能无效升高存储老本,最冷的深度归档存储相较规范存储可节俭90%存储费用;但如果业务数据须要频繁下载,则低频、归档、深度归档存储的取回费用会带来额定的老本开销,导致整体费用反而更高。 具体到业务场景中,咱们举荐: 频繁读写场景:比方UGC场景、电商图片等读多写少的业务,可应用规范存储类型。如果业务对可用性和数据持久性有高要求,则能够思考应用多可用区规范存储。大量读场景(一个月读一次):比方日志数据分析、网盘数据等业务,读取频率较低,但读取时对性能要求高,可应用低频存储类型。对可用性和数据持久性有高要求的业务能够应用多可用区低频存储。极少量读场景(三个月读一次):比方视频监控、日志数据归档等业务,读取频率极低,对读取性能要求较低,可应用归档存储类型。根本不读取场景(半年读一次):比方医疗影像、档案资料等业务,日常仅做长期备份用,对读取性能简直无要求,可应用深度归档存储类型。此外,在应用不同存储类型时,咱们倡议客户留神最小存储时长和最小存储单元的限度,同时关注不同存储类型的性能体现。下表提供了一个简略的比照。 最小存储时长:数据存储在对应存储类型时,须要存储的最短时间,不满最短时间依照最短时间算。比方低频存储起码存储 30天,如果一个低频数据只存储了1天就删除,也会依照 30天计算费用。 _最小存储单元:数据存储在对应存储类型时,须要存储的最小文件容量,不满最小文件容量依照最小文件容量算。比方低频存储起码存储 64KB,如果一个低频文件只存储了 1KB,也会依照 64KB计算费用。_ 二、定期通过清单和拜访日志功能分析数据拜访模式剖析数据的拜访模式可能为抉择正当的存储类型提供数据撑持。COS提供了清单能力和拜访日志性能,别离用于记录存储的文件元数据信息和文件拜访记录,并将这些信息转存到用户的存储桶中。 无关清单性能的具体介绍,能够参考文档配置清单性能;无关拜访日志治理性能的具体介绍,能够参考文档配置拜访日志治理。 对象存储提供了COS Select能力检索文件中的内容,如果您生成的清单文件或者日志记录过多,您也能够购买弹性Map Reduce集群,搭建Presto集群进行数据分析。 无关COS Select的能力介绍,能够参考文档应用对象检索;无关EMR进行剖析的介绍,能够参考文档应用Presto剖析COS上的数据。 以检索剖析清单文件中的数据为例,当清单报告投递到指定存储桶后,您能够进入控制台对指定的清单报告进行剖析: 1、进入文件列表,找到对应的清单报告,点击最右侧检索; 2、进入文件检索页面,配置好相应入参; 3、输出检索语句,在检索后果卡片页查看检索后果; 留神:控制台只反对检索128MB以下文件,如果清单报告的容量过大,或者报告数量过多,能够抉择工具、SDK或者API的形式调用。 以下是几种常见的检索清单报告的检索语句: 留神:清单报告中不蕴含表头信息,因而只能输出对应字段的序列号进行检索,清单报告的表头和序列号对应信息如下: 三、通过生命周期和批量解决沉降数据业务倒退过程中,数据的拜访模式始终在动态变化,对于大部分数据而言,其拜访热度个别随着存储工夫的增长而升高。因而,企业须要依据业务数据拜访模式的变动,调整数据存储类型以便业务老本处于最佳状态。 COS提供了生命周期能力帮忙企业定期地转换存储类型,企业能够通过清单和拜访日志剖析业务数据的拜访模式,依据业务拜访模式制订正当的生命周期转换规则。 以某经营社区平台的客户为例,应用COS存储用户上传的图片数据。一般而言,图片数据在刚上传后的一段时间里会被频繁拜访,通过一段时间流传后,大部分数据会逐步”变冷“,拜访频次逐步缩小。假如这一客户大部分图片数据在通过90天后数据拜访频次曾经低于1次/月,在365天后根本无人拜访,咱们能够比照设置生命周期和不设置生命周期时的老本状况: 能够看到,应用生命周期规定治理存储桶中的对象可能较大幅度地升高数据存储费用。对于长期存储的数据,合理配置生命周期规定能帮忙业务升高50%以上存储老本。 除了治理业务数据存储类型外,生命周期能力还能够用来治理存储桶中的文件碎片和历史版本文件。文件碎片是业务在上传大文件过程中,因为网络中断等意外状况中断传输产生的文件分块信息,如果业务中存在大量文件碎片,能够通过生命周期规定对文件碎片进行过期删除。历史版本文件则是开启版本控制性能后产生的旧文件信息,历史版本文件能够用于数据误删后的复原和回滚,但会占用存储空间,业务同样能够设置一个过期删除工夫,将没有用的历史版本文件清理掉,以在数据安全和老本之间进行均衡。 如下图,只须要在配置时,抉择开启【治理历史版本文件】,或者抉择【删除碎片】,即可按需进行配置。 对于个别业务,仅只须要一次性将大批量文件转为更冷的存储类型,并且没有固定的规定(比方指定的前缀或者标签),则用户能够应用COSBatch批量解决能力,应用批量拷贝性能将数据批改为其余存储类型或者增加对象标签以便设置生命周期规定删除。操作步骤如下: 1、导出待处理文件列表,整合成csv格式文件; 2、创立COSBatch批量解决工作,导入文件列表; 3、执行批量解决工作,等待工作实现即可。 具体的操作步骤能够参考COSBatch批量解决操作指南,进一步理解操作详情。 四、通过文件压缩缩小存储容量对于图片类数据,对象存储也提供了数据压缩能力帮忙用户压缩图片大小,缩小存储老本。目前提供了压缩能力如下: Gueztli压缩。Gueztli压缩是一种视觉无损压缩,利用人眼对于局部色域及图片细节的不敏感性,在不影响视觉效果的前提下有选择地抛弃细节信息,使得在雷同品质条件下比原图节俭约35% - 50%的图片大小。TPG压缩。TPG 是腾讯推出的自研图片格式,可将 JPG、PNG、GIF、WEBP 等格局图片转换为 TPG 格局,大幅减小图片大小,压缩比可达到35%以上。HEIF压缩。针对 iOS 环境的图片应用场景,可将 JPG、PNG、GIF、WEBP 等格局图片转换为 HEIF 格局,HEIF 格局有着超高压缩率,压缩比个别在45%以上。以某客户图片存储业务为例,下表比照了100TB图片存储采纳不同压缩形式后的老本收入状况: 从表中能够看到,应用图片压缩能力进行压缩后,只管会付出肯定压缩老本,但存储老本大幅度降低,理论总支出也升高了。此外,业务后续应用中会产生大量的流量,通过压缩也能极大地节约流量老本。 五、进行老本回顾老本优化须要贯通业务的全流程,而不仅仅只在业务上云时进行老本布局,客户须要不定时进行老本回顾,依照业务需要正当布局业务的云存储架构,有利于升高存储老本。除此之外,客户能够进入腾讯云计费平台,下载腾讯云计费账单理解云存储用量明细账单,剖析云存储耗费状况并针对性优化。 ...

November 20, 2020 · 1 min · jiezi

关于云存储:一文带你玩转对象存储COS文档预览

随着“互联网+”的倒退,各行各业纷纷“去纸化”,商务合同、会议纪要、组织公文、商品图片、培训视频、学习课件、随堂讲义等电子文档无处不在。而要查看文档个别须要先下载,但动辄几十上百兆的文档下载费时,如果不下载,大部分软件的预览兼容性差,和原文档内容相差甚远。若是同时查看多种不同格局的文档,还要先下载对应的阅读器,再频繁更换阅读器进行文档浏览,影响用户应用和工作进度。 如果有一款产品,能够同时反对多种类型文档以图片或html格局进行预览,突破文档格局壁垒,是不是能够无效晋升工作效率,让电子文档更简略易用、高效平安。 对象存储COS文档预览性能就能够解决这些问题。面对多元的办公场景,通过COS文档预览性能,用户能够畅通查阅不同类型的文档。 操作便捷,简略易用,无需额定运维老本对于存储在对象存储 COS上的资源,即开即用,可通过控制台一键开启性能,且无需集成额定的SDK上传,在原下载接口拼接相干参数即可上线应用。COS文档预览服务毫秒级响应,每秒超过万级并发,反对疾速动静扩容。高性能的缓存层,搭配高性能的解决集群,疾速返回生成内容,无需额定的服务器开销,无效缩小平台服务器耗费和老本保护。 无需下载,在线预览,反对格局丰盛多样反对对 doc、xls、ppt、txt等30多种文档格局在线预览,无需下载,还反对对预览图片增加水印、缩放、旋转等解决。文档服务可适配多种文档利用场景,解决文档内容的页面展现问题,保障在线浏览时最大水平保留源文档款式,满足 PC、APP 等多端的文档在线浏览需要。 如何应用包含同步预览和异步预览两种应用办法,每个账户每月领有3000次收费额度,能够随便试用文档预览性能。当初跟着我的脚步,让咱们一探文档预览的精彩世界。 1、申请前的筹备首先咱们须要有一个本人的cos存储桶,并且将源文件上传至桶中。在源文件的详情中,咱们能够不便的获取到对象地址。 2、同步预览  实时在线预览参考文档预览同步接口地址:https://cloud.tencent.com/doc...同步预览的调用操作十分的简略,最根底的预览性能只须要在咱们的对象地址后加上对应的文档预览参数即可。 即:https://markjrzhang-125170470... 文档预览反对对预览图片的解决,比方在预览图片中增加一个文字水印: 即:https://markjrzhang-125170470... 对图片进行90°旋转 即:https://markjrzhang-125170470... 3、异步预览  高效长久化参考文档预览异步接口:https://cloud.tencent.com/doc...首先咱们须要在控制台开明文档预览性能,主动生成工作队列,并获取到以后队列ID。 上面咱们开始调用创立工作接口,咱们以curl申请为例: `curl -X POST -v -H "Host: markjrzhang-1251704708.ci.ap-chongqing.myqcloud.com" -H "Content-Type: application/xml" -H "Authorization: Authorization " -d $'<Request> <Input> <Object>Preview.docx</Object></Input><Operation> <Output> <Region>ap-chongqing</Region> <Object>mark/pic-${Number}</Object> <Bucket>markjrzhang-1251704708</Bucket> </Output> <DocProcess> <TgtType>jpg</TgtType> <StartPage>1</StartPage> <EndPage>-1</EndPage> </DocProcess></Operation><Tag>DocProcess</Tag><QueueId>pc02270c617ae4b6d9b0a52cb1cfce6b3</QueueId></Request>' "https://markjrzhang-1251704708.ci.ap-chongqing.myqcloud.com/doc_jobs" -k` 申请头中的Authorization字段内容 请参见:https://cloud.tencent.com/doc...咱们能够很不便的从控制台获取到工作的执行状况。 到指定的生成预览文件地位查看曾经解决好的图片,图片的解决成果与同步接口统一。 对象存储COS文档预览性能,能够帮忙用户升高文档应用门槛,进步工作效率,让用户把更多精力放到业务价值晋升上,实用于在线教育、企业 OA、在线网盘、网站转码等业务场景。文档数据存储于 COS 中,数据跨多架构、多设施冗余存储,还提供异地容灾和资源隔离,保障业界当先的数据持久性。

November 18, 2020 · 1 min · jiezi