关于文件存储:焱融科技荣登2022中国企业数智化创新TOP50榜单

由中国信通院 EDCC 企业数字化倒退共建共享平台领导,笔记侠 & InfoQ 联结公布的“2022中国企业数智化翻新TOP50”榜单于近日揭晓。凭借在数智化科技翻新方面的突出能力和优良实际,焱融科技胜利入选其细分赛道之——数智化科技翻新 TOP20。 数智化是对数字化的延长和进阶,代表着更深的交融、更广的连贯和对数字技术更智能的利用。数智化对企业的转型降级提供了弱小的撑持,企业驾驭数据的能力成为企业的外围竞争力。焱融科技早已融入这一趋势,作为国内高性能文件存储和容器存储的领头羊,通过一直的产品技术创新,与产业链上下游生态的深度单干,构建高性能,高可用,弹性扩大的数字化转型的松软底座,满足数智化场景下海量的非结构化数据增长,从海量数据中开掘数据价值,帮忙企业将数据资源转化成真正的数据资产。作为国产性能旗舰,助力企业在人工智能、泛 HPC 场景具备高性能的存储技术,使其业务倒退步步当先。 焱融科技胜利入选“数智化企业服务翻新TOP 15”。彰显了焱融科技一直保持前沿技术的摸索,引领数智化降级的科技翻新实力,助推产业数字化降级方面突出成绩的认可。 正如主办方所提到的,随着数字经济新时代的到来,将来只有两种企业,一种是逐步走向败落的,一种是乘着数智化慢车蓬勃发展的。焱融科技将保持技术创新,赋能更多企业数智化转型,助力企业挖掘数字红利。

March 17, 2023 · 1 min · jiezi

关于文件存储:最佳实践|焱融全闪存储实现与美的集团破千万-IOPS-性能

焱融全闪文件存储实现国内制造业首个双 200Gb 网络聚合分布式文件存储集群部署,实现 AI 计算平台破千万 IOPS 性能。 后疫情时代,集体与居家环境的关系悄悄地产生着变动。随着人们在家里破费的工夫更多,打造舒服、便捷、智能化的居家生存环境成为不少人关注的方向,智能家居让生存变得更高效更乏味。 美的团体是一家寰球 500 强企业,其业务笼罩智能家居、楼宇科技,工业技术、机器人与自动化和数字化翻新业务五大板块。近些年来,美的从新定义行业智能规范,通过技术革新推动用户连贯体验晋升,将“全面数字化、全面智能化”作为企业倒退的策略体系。2021年10月,美的就创新性地提出联合物理空间、互联网空间、虚拟空间的“元家居”的概念,基于感知、通信、AI、大数据、虚拟现实等根底技术,实现数字家庭孪生,提供全新的物联网利用与交互体验,让用户享受更深刻的智能服务。 宏大的数据规模 存储架构降级迫不及待 美的 AI 翻新核心在技术方面有六个钻研方向,即语音,计算机视觉,导航,边端智能,常识图谱,机器人学习。随着美的人工智能翻新核心 GPU 服务器节点规模以及数据规模的一直增长,对存储系统的容量、性能和可管理性提出更为刻薄的要求。目前正应用的存储计划广泛是针对规范的负载类型,在须要满足数据密集型利用负载的数据拜访需要时迎来很大挑战。现阶段美的人工智能翻新核心面临以下问题: 随着日益增长的数据,现阶段小文件数量已达 10 亿,预计前期可能冲破百亿级别,现有的存储性能随着数据量的增长出现衰减趋势;随着 GPU 服务器的增多,客户端的并发数出现指数级别的增长,目前的并发节点已冲破上百台,并发节点越多越容易呈现客户端夯死或者解体的状况;在日常模型训练过程中,存储端的性能瓶颈尤为突出,使得整个 GPU 集群无奈施展出极限性能,训练效率极大地升高;现有的存储在对接下层容器业务显得越发吃力,无奈为容器化训练提供长久化和灵活化的拜访能力;焱融在和美的一起对业务逻辑进行深度的剖析和梳理,发现美的人工智能翻新核心对于存储的需要须要满足以下几点: 撑持数千台节点的高并发拜访而不解体;保障模型训练中存储的高 IOPS、高带宽、低延时的拜访能力,为 GPU 服务器提供足够高的存储数据传输带宽,充沛开释 GPU 算力;撑持百亿级别的文件的读写性能和元数据操作性能,满足大量特色文件或聚合后的文件的存储需要;能够为下层训练模型利用提供标准文件接口用于数据拜访,并为容器化的训练任务提供灵便的数据拜访能力;能够兼容高性能网络,可能反对最高 400Gb 的 IB 网络,能将存储能力通过高性能网络供应到计算层,实现数据流转;美的须要解决以上问题来满足 AI 计算场景对存储的极高 IOPS 和带宽、极低延时需要,撑持整个翻新核心的算法工程师的人工智能模型的开发和训练。 全闪文件存储为美的打造高性能 AI 训练平台 基于以上诉求,本次计划建设指标是: 降级训练平台,晋升算力,减速开发和训练 AI 模型,晋升企业数字化竞争力;构建可能匹配大规模 GPU 计算集群数据拜访需要的存储与网络系统。将计算、网络、存储三个外围能力达成完满匹配,最大化晋升整体平台算力输入,以满足客户业务需要和整体 AI 训练效率的晋升,更好地撑持算法工程师开发和训练人工智能模型。焱融全闪分布式文件存储达成了存储性能与建设老本兼顾的解决方案,弹性空间扩大能力,无效均衡数据存储老本。联合 InfiniBand 技术和追光 F8000X 针对海量小文件高并发拜访等方面的优化设计,取得了超高性能体现。同时,得益于分布式存储架构、数据智能加载和分层性能,针对异构存储并存的利用场景,灵便高效地驱动数据在不同存储平台流动,不便用户组织数据集进行计算剖析;应用 F8000X 将数据依照生命周期管理策略分层到本地低速存储或者云端,对业务端提供对立命名空间,升高应用复杂度,晋升了数据存储应用的经济性。 集群内单存储节点性能可达 200 万 IOPS 性能,40GB/s 带宽;反对横向扩大,性能随节点线性晋升,在 6 存储节点下,性能可达 1000 万+ IOPS,200GB/s +带宽;以下是解决方案中的根本组件:存储系统:焱融追光 F8000X 全闪分布式存储一体机集群计算零碎:多卡 GPU 服务器集群网络系统:NVIDIA Quantum InfiniBand Switch & 万兆以太网络 ...

March 16, 2023 · 1 min · jiezi

关于文件存储:分布式存储中建立高效回收站的设计思考

咱们心愿分布式文件系统下的回收站是一个高效的回收站零碎。在实现的时候须要思考性能问题,不能去影响失常的io申请,在复原的时候是一个比拟轻的操作,并且须要有肯定的扩展性。 应用 Windows 的用户对回收站并不生疏,它给了咱们一剂“后悔药”。回收站保留了您删除的文件、文件夹、图片、快捷方式和 Web 页等。这些被删除的我的项目将始终保留在回收站中,直到您清空回收站。许多被咱们误删除的文件都是从这外面找到的。灵便地利用各种技巧能够更高效地应用回收站,使之更好地为咱们服务。 回收站是一个非凡的文件夹,默认在每个硬盘分区根目录下的 RECYCLER 文件夹中,而且是暗藏的。当你将文件删除并移到回收站后,本质上只是把删除的文件放在了这个文件夹里,依然是占用磁盘的空间。只有在回收站里删除它或清空回收站能力使文件真正地删除,能力为电脑开释出更多的磁盘空间。 惯例的回收站解决的是单机存储、甚至单硬盘层面的问题,并不波及数据的分片寄存、冗余策略等场景,所以在以后宽泛应用的分布式存储的场景下,回收站须要有更多的特点,让它更加适宜分布式存储的数据行为。 01 分布式存储场景下回收站 VS 传统回收站 在传统的 linux 零碎之中,常见的解决方案就是将 rm 操作转化为 rename 操作。而在分布式系统中,文件都随机散布在各个节点,跨节点挪动文件是很耗费资源的。特地是在大批量删除的状况下,可能会造成零碎卡顿。所以咱们须要针对分布式的场景设计一套删除流程,让被删除文件落到回收站中来,但不须要挪动文件。 大量的文件寄存在回收站,咱们须要有一个策略那就是从回收站中回收空间,删除过期的数据。在分布式系统中,文件数量会很多,海量的文件删除都是须要放到回收站中,这样咱们在清理的时候就不能去扫描目录构造,而是须要有一个索引依照一些规定来疾速地查找指定的文件。 通常状况下,一个分布式文件系统有大量的用户在同时应用,这须要咱们针对不同的用户目录设置不同的回收站,不同的用户视角都能看到本人的回收站。大家晓得,分布式文件系统下元数据和数据是离开保留的,这是一个劣势,咱们能够在删除文件的时候只将元数据放入回收站中,而复原的时候只须要将对应的元数据恢复就能够了。 下面是分布式文件系统和传统文件系统在实现回收站时的一些次要因素。咱们心愿分布式文件系统下的回收站是一个高效的回收站零碎。在实现的时候须要思考性能问题,不能去影响失常的 io 申请,在复原的时候是一个比拟轻的操作,并且须要有肯定的扩展性。 02 YRCloudFile 分布式文件系统是如何设计回收站的? 咱们在将文件删除的时候,依据门路匹配到对应的回收站,将对应的元数据信息放入以后元数据节点的 rocksdb 中,依据肯定的规定来建设索引。文件复原的时候只须要将对应的元数据还原到指定地位。而当彻底删除文件时,咱们会将文件的元数据放到后盾 gc 工作队列里,而后由 gc 线程去异步的清理数据。咱们用一张示意图来看下这个过程:在回收站的性能中,为了实现指定目录复原/清理,指定工夫复原/清理,咱们在回收站中增加了以下两个表。咱们会依赖 rocksdb 的 key 排序功能,能够依据指定目录/删除工夫,疾速的过滤文件,保障复原以及过期清理时的效率。而且不同的文件会散布在不同 id 的回收站中去,实现了回收站资源之间的隔离。而且因为 rocksdb 优越的程序读写性能,在查找的场景下性能体现会十分的好。以上设计能解决在分布式场景下,海量的数据删除/复原,在只解决元数据的计划状况下,回收站的性能齐全能够满足大型分布式文件系统的需要。分布式文件存储是一个非常复杂的零碎,这外面有着许许多多的问题期待咱们去解决,回收站只是其中一个,前面咱们还须要一直地学习去解决更多的问题。

March 16, 2023 · 1 min · jiezi

关于文件存储:焱融科技发布国内首个NVIDIA-DGX-A100-全闪存储参考架构白皮书

为了一直推动人工智能(AI)、高性能数据分析和 HPC 畛域的基础设施,焱融全闪存储解决方案对 NVIDIA® DGX A100 零碎 AI 利用进行了性能优化,实现单存储节点达到了40GB/s+ 带宽和 200万+ IOPS 性能,帮忙企业胜利建设高性能存储平台,使其业务翻新迅速进入快车道。 焱融科技作为业界当先的分布式文件存储厂商于近日公布国内首个NVIDIA DGX A100 + 全闪存储参考架构白皮书。NVIDIA® DGX A100 零碎是世界上第一个 5Petaflops 的人工智能零碎,它将整个数据中心的能力整合到一个灵便的平台上,实用于所有 AI 工作负载,包含剖析、训练、推理的通用零碎。焱融高性能存储解决方案匹配可扩大的 NVIDIA DGX 环境,整体解决方案集成了焱融追光 F8000X全闪存储系统、NVIDIA® DGX A100 零碎和 NVIDIA® Mellanox® InfiniBand 网络系统。基于高扩展性、高性能和大规模的方案设计准则提供全面的优化。 随着 AI、数据分析、HPC 等新型利用的高速倒退,企业基于 GPU 的高性能服务器,开发 AI/ML/DL 模型,旨在海量数据中开掘微小的商业价值。而达到这个目标外围不仅须要弱小的算力(比方以后采纳算力十分强劲的 GPU 和 CPU ),而且还须要高速互连和存储系统,让它们能依照算力所需的速度传输数据。这就要求计算平台、共享存储平台以及网络系统以均衡的形式协同工作,且互相性能必须放弃高度匹配,能力实现对实时、大规模、多样化数据进行高效的计算剖析。所以构建高性能的计算基础架构要同时满足:焱融追光 F8000X 全闪存储广泛应用于人工智能(AI)、高性能数据分析和 HPC 畛域。基于 F8000X 存储的焱融 GPU 集群存储解决方案为 AI 企业用户提供了一个包含共享存储、计算、网络及其他基础架构的规范性解决方案,为 AI、HPC、主动驾驶和其余计算和 I/O 密集型工作而设计。基于可灵便扩大的共享并行架构并通过全面优化,能以高吞吐量、低提早和大规模并发形式传输数据,为客户带来卓越的性能和经济收益,是匹配 GPU 集群利用场景的现实抉择。 该白皮书具体介绍由 NVIDIA DGX A100 GPU 计算零碎、 NVIDIA Mellanox QM8700 网络系统和焱融 F8000X 全闪分布式文件存储系统组成的 AI/HPC 计算基础架构。通过测试数据能够看出,焱融 F8000X 可能满足 DGX A100 集群的大规模并发数据拜访,并且依据计算集群规模放弃同步并线性地扩大性能和容量。无效打消了存储性能瓶颈,充沛开释了GPU 计算后劲,轻松应答更重工作负载性能要求。 ...

March 15, 2023 · 1 min · jiezi

关于文件存储:打破文件锁限制以存储力量助力企业增长新动力

导语:在多过程共享的应用程序中,通过“锁”来对同一个计算资源进行协同是十分常见的做法,无论在单机或多机系统、数据库、文件系统中,都须要依赖“锁”机制来防止并发拜访导致的不确定后果。文件锁的劣势不言而喻,但它的弊病又是什么呢?明天,咱们就来讲讲文件锁背地的利与弊。 什么是文件锁?文件锁指的是,把某个文件锁定,除了以后过程能拜访以外,别的过程不能拜访该文件。进而又分为读锁和写锁,读锁又名共享锁,它能够用于避免过程读取的文件记录被更改。同时,文件记录能够设置多个读锁,但当有一个读锁存在时,就不能在该记录处设置写锁。写锁又名互斥锁,它用来保障文件更改记录时不被烦扰,确保文件一致性和完整性,避免写失落或读“脏”数据。 文件锁能够说是,文件系统的最根本个性之一,应用程序借助文件锁能够管制其余利用对文件的并发拜访。文件锁作为一种互斥机制,可确保多个过程以平安的形式读取/写入同一个文件。之所以要对这些多过程业务进行管制,就是因为这些过程的调度是不可预期的,这种时序上的不可预期会对同一个文件资源产生竞争性拜访,从而带来意料之外的后果。 为了帮忙大家更好地了解,咱们举一个: 假如,咱们有一个叫“account.dat”的文件,用于存储账户余额,外面当初有“200”的初始值。这时,在并发零碎中有两个过程,它们将要更新文件中的余额值: 过程 A:读取以后值,减去 20,而后将后果保留回文件中;过程 B:读取以后值,加 80,而后将后果写回到文件中。如果用小学生罕用的加减法来计算,那么咱们将会取得 200-20+80=260 的余额 。然而,如果过程没有依照预期程序执行,咱们可能会播种不一样的后果: 1、过程 A 读取文件的以后值(200),并筹备进行进一步的计算;2、这时,过程 B 读取雷同的文件并取得以后余额(200);3、过程 A 计算 200-20 并将后果 180 保留回文件;4、过程 B 不晓得余额已更新。5、因而,它仍将应用过期的值 200 计算 200 + 80,并将后果 280 写入文件。6、这时,咱们的 account.dat 文件中保留的余额就是 280。 因为分布式文件系统次要用于多个客户端中共享文件,客户端的应用程序并发拜访文件是很常见的操作,在理论利用中,渲染、HPC 等业务都须要应用到文件锁,锁的反对对分布式文件系统而言至关重要。如果你触发到文件锁的限度导致报错,那么头疼的问题来了,它会重复报错,而你还拿它没方法。 当初,优锘科技正在面临这样的问题。优锘科技是数字孪生可视化畛域的先行者及践行者,通过可视化的伎俩对实体对象进行仿真、监测、剖析和管制,致力于通过数字孪生可视化技术,帮忙人们更好地认知与治理事实世界。 近年,随着数字孪生一直倒退,无效帮忙企业晋升透明度与可见性,强化管理者的控制能力。在此时机下 ,优锘科技打造了数字孪生体系,其蕴含自研的渲染引擎 T3D 和基于 WebGL 的物理引擎、一系列 2D&3D 的工具、业务配置工具、各类现成可用的资源,以及生态空间,不便多方满足数字孪生个性化需要。借助数字孪生技术,咱们在肯定水平上解脱事实的解放,在虚拟环境下发展一系列纯数字模式的钻研。在满足了企业对数字孪生技术的要求,优锘科技旨在进一步晋升企业用户应用体验,增强优锘科技技术底座。 面临挑战:优锘遇上文件锁,技术实力“被封闭”原先,优锘科技在私有云上曾经部署了数字孪生平台,并以 SaaS 的模式为用户提供服务。每个用户在应用过程中,会创立一套本人的环境,其中包含 1 套软件和 2 个 NFS 挂载点。在整个过程中,如果用户应用云上原生的文件系统时,创立并初始化 200 个 pod,那么就会因为触发文件锁限度而报错,导致用户需要无奈失去满足。文件锁“锁住”的不仅仅是防止并发拜访导致的不确定后果,更是“锁住”了优锘倒退的脚步。 “咱们已经调研过很多私有云平台,文件锁根本都在 8192,想过很多种方法都无奈解决它。”优锘科技技术人员认为,“这是一个火烧眉毛的问题,如果不能解决,咱们将很难对产品进一步降级。” 在深度还原客户理论工作场景,进行粗疏的察看和推导后,焱融团队认为事不宜迟是对存储架构进行降级,晋升其存储集群性能和存储通量。焱融科技在优锘科技私有化部署 YRCloudFile 存储集群,客户端通过 NFS 挂载存储的形式,让文件系统实现无文件锁,突破同时关上文件数量和并发数量等方面的限度,使技术人员顺利创立并启动 300 个环境。 ...

August 1, 2022 · 1 min · jiezi

关于文件存储:realsense深度图像读取对齐与保存

图像采集realsense间接读取进去的彩色图片和深度图片是没有对齐的,读取进去的两张图片像素之间没有一一对应。然而个别应用两张图片是须要对齐的,并且间接利用深度信息。 以下程序为了更加不便的采集数据。程序运行后q退出,s保留图片。 import pyrealsense2 as rsimport numpy as npimport cv2import timeimport ospipeline = rs.pipeline()#Create a config并配置要流式传输的管道config = rs.config()config.enable_stream(rs.stream.depth, 640, 480, rs.format.z16, 30)config.enable_stream(rs.stream.color, 640, 480, rs.format.bgr8, 30)profile = pipeline.start(config)depth_sensor = profile.get_device().first_depth_sensor()depth_scale = depth_sensor.get_depth_scale()print("Depth Scale is: " , depth_scale)align_to = rs.stream.coloralign = rs.align(align_to)# 依照日期创立文件夹save_path = os.path.join(os.getcwd(), "out", time.strftime("%Y_%m_%d_%H_%M_%S", time.localtime()))os.mkdir(save_path)os.mkdir(os.path.join(save_path, "color"))os.mkdir(os.path.join(save_path, "depth"))# 保留的图片和实时的图片界面cv2.namedWindow("live", cv2.WINDOW_AUTOSIZE)cv2.namedWindow("save", cv2.WINDOW_AUTOSIZE)saved_color_image = None # 保留的长期图片saved_depth_mapped_image = Nonesaved_count = 0# 主循环try: while True: frames = pipeline.wait_for_frames() aligned_frames = align.process(frames) aligned_depth_frame = aligned_frames.get_depth_frame() color_frame = aligned_frames.get_color_frame() if not aligned_depth_frame or not color_frame: continue depth_data = np.asanyarray(aligned_depth_frame.get_data(), dtype="float16") depth_image = np.asanyarray(aligned_depth_frame.get_data()) color_image = np.asanyarray(color_frame.get_data()) depth_mapped_image = cv2.applyColorMap(cv2.convertScaleAbs(depth_image, alpha=0.03), cv2.COLORMAP_JET) cv2.imshow("live", np.hstack((color_image, depth_mapped_image))) key = cv2.waitKey(30) # s 保留图片 if key & 0xFF == ord('s'): saved_color_image = color_image saved_depth_mapped_image = depth_mapped_image # 彩色图片保留为png格局 cv2.imwrite(os.path.join((save_path), "color", "{}.png".format(saved_count)), saved_color_image) # 深度信息由采集到的float16间接保留为npy格局 np.save(os.path.join((save_path), "depth", "{}".format(saved_count)), depth_data) saved_count+=1 cv2.imshow("save", np.hstack((saved_color_image, saved_depth_mapped_image))) # q 退出 if key & 0xFF == ord('q') or key == 27: cv2.destroyAllWindows() break finally: pipeline.stop() ...

March 14, 2021 · 1 min · jiezi

关于文件存储:给力文件共享企业云盘办公平台有何优势

文档和数据是企业用户最外围的资产,随着软件定义存储的时代的到来,文档云存储、云合作也成无奈阻挡的趋势。文件密级治理用于标准公司外部各类文件材料的治理,爱护公司各项秘密成绩文件、保护公司的知识产权。从进步文件治理的效率和品质,又实现文件的平安和窃密,抉择Yotta企业云盘一款适宜作为企业新的文件共享零碎。员工流动带来重要文件散失,且没有文件操作日志,误操作难以追责海量文件,难以疾速精确查找所需文件 那么企业云盘有哪些劣势呢?1.保障材料的安全性和便捷咱们再保留材料方面都存在着很多问题,有时候会失落或者不小心删除了,查找起来也不不便,很多行业在进行经营布局的时候,个别都会生产进去很多材料还有文件,这些文件都是须要进行妥善保留才能够的,如果仍旧是利用纸质文件贮存的话,不仅不平安,而且也十分占地位,平时查找也很麻烦,然而通过企业云盘解决方案后,就能够解决这个难题,企业云盘不仅能够保留材料还能够将文件/文件夹挪动到其余文件夹中,挪动后以后文件夹则无该文件/文件夹,挪动可实现跨空间挪动。咱们在须要用到某一个文件的时候能够间接搜寻文件夹的名字,这样不便又快捷,给咱们在查找文件方面节约了很多工夫,应用了网盘后,能够取得文件顺利贮存的成果,能够无效的保障材料的安全性,同时会将材料进行集中保留,避免材料难以查找。2.随时随地进行贮存置信不论是什么行业的人,都会有这样的经验,那就是手里有很重要的文件,然而不适宜及时的回到公司进行贮存,所以就会放心文件放在家里呈现脱漏或者是失落等问题,会带来的损失和影响十分大,因而企业云盘解决方案也针对这个问题,进行了相干的解决,企业云盘同时能够在手机电脑上应用,这个操作毫无疑问是很有益处的,可能帮助文件及时进行贮存,做到随时随地。3.共享合作智能化Yotta企业云盘企业数据安全存储共享合作智能化,在数据失落、数据外泄等事件往往会触发企业对数据存储的转移。企业云盘的数据集中管理、多冗余备份策略,让其成为目前数据安全的存储形式。一方面,所有的数据通过几重加密算法的爱护,另一方面,通过权限调配数据的人员拜访权。并且在企业的理论工作中,对文件共享的平安爱护要求可能远不止这些,如防扩散、防截图、主动删除过期等。企业云盘具备此性能。当然,Yotta企业云盘还能够实现加密和共享的要求,能够依据须要灵便设置接收者更精密的应用权限,避免透露文档的二次扩散。因为企业云盘,高性价比,治理高效的文档管理系统,性能更丰盛,治理更业余。实现数据智能备份、集中存储、集中受权,以及对企业的外围数据安全管控的企业云盘。4.高效操作文件 对于很多员工来说,在针对文件的查找还有更改上,必定都是会感觉非常麻烦的,特地是在查找文件这件事件上,会耗费十分多工夫进行。然而通过企业云盘解决方案加持后,应用网络云盘后就能够解决这个问题了,能够利用查找文件性能间接查找相干文件,其次能够间接关上文件进行批改贮存,非常不便。员工在须要发送文件和分享文件方面也是特地不便的。5.协同办公、工作进步在Yotta企业云盘中同一个文件能够多人同时进行批改、编辑等操作,并且对源文档批改编辑后会生成历史版本,须要查看历史版本都可重回去查看。这样能够在协同办公环境中随时把握我的项目进度。 企业云盘是将来企业随着时代提高的工具,它能让企业更高效、更便捷地晋升效率,从而占据市场。让用户应用释怀,体验顺心,安全可靠。

December 14, 2020 · 1 min · jiezi