关于字节跳动:字节跳动开源云原生机器学习平台-Klever

9次阅读

共计 1124 个字符,预计需要花费 3 分钟才能阅读完成。

SegmentFault 思否音讯,字节跳动技术团队官网微信公众号公布音讯称:「字节跳动基础架构团队基于火山引擎机器学习平台 Clever 及其丰盛的行业落地教训,推出开源我的项目 Klever,以工程化的形式升高智能技术落地门槛,助力企业疾速打造智能业务。」

我的项目地址:https://github.com/kleveross


Klever 是一个反对 OCI(Open Container Initiative)规范存储训练模型、反对在线模型服务部署的云原生机器学习平台。算法科学家能够应用 Klever 进行 模型治理 模型解析 模型转换 模型服务,它曾经解决了智能技术落地流程中的如下问题:

  • 模型的治理和散发
  • 模型解析和转换
  • 在线模型服务部署和治理

同时,基于字节跳动在机器学习和云原生开源社区的技术积攒,Klever 提供弱小、通用的开源技术标准,不便企业无缝迁徙线上利用。

换句话说 Klever 的次要性能是解决,算法技术选型到模型最终上线过程中波及到的大量工程化工作对接,从而解放算法工程师的「双手」,让他们能够聚焦在算法模型上,不用为大量繁琐的配置工作浪费时间。

当初,在字节跳动外部在基于各类实际欠缺云原生机器学习工程化平台的构建想法,丰盛 Klever 的性能和外延。在内部市场,火山引擎推出的商业化版机器学习平台 Clever 已在金融、制作、批发、能源等行业领有成熟的解决方案。

Klever 的概述

零碎架构

Klever 有四个自研发的组件,并依赖三个开源组件:

  • ormb:模型打包、解压、上传、下载工具
  • model-registry:模型仓库及模型服务 API 管理层
  • modeljob-operator:ModelJob controller,治理模型解析、模型转换工作
  • klever-web:前端组件
  • Istio:开源服务网格组件,模型服务通过 Istio 对外裸露模型服务地址,实现模型服务按内容分流和按比例分流
  • Harbor:模型底层存储组件,对模型配置和模型文件进行分层存储
  • Seldon Core:开源模型服务治理的 Seldon Deployment CRD 的 controller,通过 SeldonDeployment CR 实现模型服务的治理

CI 规范的模型仓库治理,用户能够像应用 Docker 治理镜像一样治理机器学习模型。

其次,整个零碎可通过容器化的形式部署在 Kubernetes 容器治理平台之上,用户无需治理模型解析、模型转换、模型服务理论运行在哪台物理机之上,零碎会主动调度和运行资源短缺的机器,并在模型服务负载较高时主动弹性伸缩。

最初,因为机器学习在不同训练过程中往往应用不同的数据集,会产生不同的模型,Klever 反对多种模型服务运行时,可将产生的模型用于提供生产环境可用的在线服务。

正文完
 0