共计 5194 个字符,预计需要花费 13 分钟才能阅读完成。
2022 年 5 月 22 日,星策社区携手微众银行、第四范式、中兴通讯等共建单位的技术专家们,独特召开社区首届“企业智能化转型 meetup”。本次流动向大家介绍了如何利用开源 BI & AI 技术,帮忙企业实现信息化—数字化—智能化转型三阶段,搭建本人的 BI、AI 平台,并晋升 AI 模型性能,升高企业老本。
本期 Meetup 嘉宾分享 PPT 获取形式:关注公众号 「星策开源」 并回复「0522」
精彩内容回顾
Part1:收场 + 企业数字化转型旅程的三个阶段——谭中意
企业数字化转型的指标是放弃企业的持续增长,后果是要把企业转变成为能依据市场变动而一直进化和疾速迭代的企业,这个转变的过程称之为企业数字化转型。现如今,“转型”曾经变得十分紧急和重要,他曾经不再是选不选和干不干的问题,而是干得快和慢、好不好的问题,是决定将来企业外围竞争力的问题。其中,智能化转型是企业数字化转型的高级阶段。
什么是企业智能化转型?
如上图所示,转型的指标是为了业务增长。从内部视角来看,企业进行智能化转型之后,用户体验、外围经营都将晋升,商业模式也会进行批改。从外部企业 CEO 的视角来看,企业的业务感知变得数字化,业务执行也变得数字化,而最要害的是企业经营决策也要变得数字化和智能化,另外还有企业的上下游生态也须要随之变得数字化。这些数字化带来的后果就是转型,让企业转变成为能依据变动而一直进行变动、进化和疾速迭代的企业,这个过程就是企业的数字化转型。
企业数字化转型的旅程的三个阶段
一般来说,企业数字化转型的旅程分为三个阶段,即信息化、数字化、智能化。离开来看,第一阶段信息化,就是传统的办公电子化,财务电子化,这个阶段的特色是应用大量的 OA 和财务软件。第二个阶段数字化,它的特色是业务的线上化,经营的数字化,它采纳了大量的数据平台和在线平台。第三阶就是智能化,这个阶段企业的业务会智能化,经营智能化,企业会大量应用各种 AI 平台。
而通常状况下,当企业实现了信息化,下一步将开始搭建 BI 零碎,将要对接各种数据源,造成各种可视化报表。其中,如何疾速搭建一个 BI 零碎,能够参考应用星策社区开源我的项目 Data Sphere Studio。之后,当企业建完 BI 零碎开始搭建 AI 时,将面临 AI 落地过程的挑战与难题,如何做到 AI 的多、快、好、省的开发和上线?能够参考应用星策社区开我的项目 OpenMLDB。最初,在 AI 上线后,面临着多种机器资源、AI 模型,想要晋升其性能、降低成本,则可参考应用星策社区开源我的项目 Adlik,让 AI 服务更省、更快、更优,以此减速企业智能化转型。
Part2:企业数字化转型,从大数据平台开始——Andy
微众银行作为数字银行,所提供的服务都是在互联网上进行的。因而,作为数字银行,微众的数字化思路尤为值得参考。从几年前,国家就始终在谋求企业怎么去做数字化,怎么去做数字经济,尤其是在十四五布局以来的话,数字经济曾经是十分明确的倒退次要指标。而明天,怎么去推动整个产业的数字化转型,怎么去做数字化,用一个比拟通用的模型,5W1H 来思考几个话题,到底企业的数字化转型是什么?为什么要数字化,当初咱们在什么阶段?应该在什么场景去做?以及哪些企业?怎么去做?
- What:什么是数字化转型?数字化的转型次要就是用数字化技术与业务进行无效的整合,在与一些业务流程跟产品革新结束之后,可能做到开源、降本、增效,甚至做到新的商业模式产生,这种数字化才算是胜利的。
- Why:为什么要做数字化?数字化转型最终目标是开源、降本、增效。开源就是开源节流的开源,须要关注怎么去创收,通过数字化的形式去触达更多的客户。降本,则须要关注怎么去应用新技术节约老本。增效,简略来说就是应用自动化的协同工具晋升工作效率。
- When:什么阶段适宜?不同企业的不同阶段都是有很大差别的,倡议在主营业务稳固的时候,立刻启动数字化转型的摸索。
- Where:什么场景适宜?一般来说,先从增量的业务开始做,因为这是一个摸索和尝试的过程,一旦增量的业务比较稳定做好了,再迁徙到外围业务。
- Who:哪些企业须要数字化?其实,所有的企业都须要做数字化,哪怕是中小微企业,甚至集体工商户,都能够通过应用数字化工具,大幅度提高企业的效率。
- How:怎么去做?从技术方面来说,须要抉择适宜的技术路线和合作伙伴。术业有专攻,目前市场上很多有成功经验的合作伙伴,企业须要筛选合乎本人的合作伙伴,共建数字化零碎。除了寻找合作伙伴以外,还须要投入人力物力进行学习。
在转型过程中,无论无论各个企业怎么做转型,数据的解决都是十分重要的,大数据平台也成为了企业数字化转型的必要工具。在大数据行业中,曾经存在了大量的大数据企业,能帮忙企业转型。而目前看到很多一站式大数据平台,大多数厂商付费所提供的,像开源的一站式大数据平台在以后市场上是非常少的。微众作为一家数字银行,更加聚焦于一站式的开源大数据平台,将微众所用的大数据平台 WeDataSphere 凋谢进去,为整个行业开源提供了一站式、金融级、全连通、开源凋谢大数据平台套件。
上图是 WeDataSphere 的整体框架,底层使用的是内部的根底引擎,两头通过中间件 linkis、DataShspis 连贯到最上层的各个利用,这些利用包含了几个方面,别离是数据的剖析工厂、学习工厂,还有数据的治理工厂,能够满足了绝大多数的利用场景,以及最右侧的一些数据管理工厂。
聚焦于图片左上角,DataSphere Studio 是利用开发集成框架,它能够集成目前所有的组件,是一个治理框架。Scriptis 反对脚本 IDE 开发环境,它反对 Spark 还有 SQL 等等支流的脚本。Visualis 是可视化的工具,当初曾经集成到 DSS 的门户外面了,能够通过利落的形式来实现可视化,目前它反对了很多种的图表、可视化的大屏、水印、数据品质校验等等的一些根底性能。接下来还有数据调度的 Schedulis、数据交换 Exchangis、流式计算利用开发治理 Streamis、以及跨集群数据同步 Transportis 和数据模型开发治理 MIDE 等。这些组件最初整体造成了现在的大量数据分析的平台。
现如今,WeDataSphere 的沙箱环境试用企业超过 1800 家,自行搭建试用 / 上生产的企业超过 800 家,波及到金融、互联网、通信、制作、教育等泛滥行业;典型用户如电信天翼云、平安保险、交通银行、Boss 直聘、蔚来汽车、华中科技大学国家高性能计算中心等。
Part3:OpenMLDB 减速企业上线智能化利用——卢冕
智能化转型离不开 AI 的转型。在 AI 转型过程中面临着诸多问题与挑战,比方现在的市场上,95% 的工夫都花在数据上,但市面上如此繁多的与数据相干的开源软件,像 hadoop,Mysql 等等,却并没有齐全解决人工智能落地的工程挑战。在这些挑战中,最关键问题往往是围绕着数据和特色的问题。如何解决特色问题,减速企业上线智能化利用呢?
上图是机器学习利用从开发到上线的整体流程,能够看到,MLOps 生命周期会分为离线开发和线上服务两个绝对独立的流程。在这每个流程中都可能会经验信息的载体从原始的 Data 到 Feature 始终到最初 Model 的转变过程。而 OpenMLDB 正是解决了两头 Feature 局部的难题,比方如何解决线上线下一致性校验带来的昂扬工程化落地老本问题。
OpenMLDB 是一个开源机器学习数据库,提供线上线下统一的特色平台。如上图所示,从最外围的角度看,OpenMLDB 有一个很显著的特点,就是把线上线下的编程语言对立成 SQL。这样不论是离线开发,还是最初线上,所有特色的定义表白,以及计算表白,都通过对立的 SQL 去形容,只有数据科学家能把特色用 SQL 表达出来,就能够在 OpenMLDB 里同时做离线开发和上线,达到开发即上线的目标。
从 OpenMLDB 外部来看,蕴含线上和线下两套解决引擎。线下是一套批处理的这个 SQL 引擎,基于 Spark 做了源代码级别的优化,让他能更好地解决特色计算的逻辑。而线上基于低提早、高并发高可用的需要,从零开发了一个时序特色数据库,并针对这个时序数据去做优化的。保障了两个引擎之间的线上线下一致性。两头的执行打算生成器,是把数据科学家定义的 SQL 转换成线上和线下具体的执行打算,同时人造的去保障这个执行打算的这个一致性。最终达到了开发及上线的目标,省下了大量的人力老本,很好的解决了线上线下的一致性问题。
实际上,OpenMLDB 也有很多的应用办法,如上图,一些公司在业务刚开始的时候,还没有上线需要,可能就用 Python 开发一下。但随着业务的增长,如果开发的脚本须要上线,就能够应用 OpenMLDB 全流程应用形式,即应用离线引擎、在线引擎,同时充沛满足线上线下一致性,达到从离线开发到实时线上计算的残缺流程。另外在社区也看到一些用户只应用 OpenMLDB 的在线引擎,比方曾经有特色脚本了,但这个特色脚本在以前的在线引擎状况下满足不了需要,就能够把它迁徙到 OpenMLDB 上。另外还有一部分用户,可能没有上线需要,或者说他没有这个实时性的上线要求,这种状况下,他其实能够用 OpenMLDB 的离线引擎,用 Spark 发行版做特色计算,也会算的比 Spark 社区版更快。
Part4:Adlik 让 AI 服务更省、更快、更优,减速企业智能化转型——袁丽雅
家喻户晓,人工智能的两个重要阶段,包含离线训练和在线推理。其中训练阶段能够分成两个步骤,一是数据采集,预处理以及打标签的过程,也能够通过像 OpenMLDB 这样的开源我的项目,来实现相干实时计算。通过这些数据能够训练出可能达到最终训练成果的模型,而后再把这个模型部署到正式的生产环境当中去。二是推理阶段,它的整个流程看起来如同是简略很多,如同只有把训练好的模型部署好,跑起来就行,但实际上,这个阶段也是有很多坑要踩,同样面临很多挑战。所以推理阶段的挑战,也是 AI 整个模型落地的挑战。
如上图所示,AI 模型落地的挑战其实包含四大方面,如何将模型和业务联合?如何高效部署模型? 如何确保模型以最优性能运行?如何无效治理生产环境中的模型呢?针对以上四个问题,中兴提供了 Adlik 的解决方案。
Adlik 是一个深度学习推理减速工具,能够将深度学习模型从训练实现,到部署到特定硬件并提供应用服务的端到端工具链,实现模型从研发状态到生产应用环境的高效切换。同时,他也能够与多种推理引擎合作,提供灵便的模型减速、部署、推理计划,助力用户构建高性能 AI 利用,帮忙企业在落地模型时达到更省、更快、更优的成果。
上图是 Adlik 的架构图,次要分成两个大的局部,一是模型的优化器以及编译器的局部,次要性能是晋升模型的计算效率以及缩小能耗,最终升高模型在部署环境当中的推理试验。另一部分,就是推理引擎,可能反对云边端等多种环境下的这个模型的高效部署。
应用 Adlik 能够让企业更省、更快、更优的落地 AI 模型
- 更省:Adlik 可能实现工程化参数的自适应优化,升高部署复杂度,达到部署人力的节约。它还提供了一个简略不便的这个模型部署 pipeline,大大的缩短模型上线的周期,节俭了部署的工夫。另外,它提供了对立的模型推理以及治理的接口,节约模型迁徙的老本。
- 更快:Adlik 内置了多种高性能运行时,以供用户更快地按需选用。其次,它提供了可拓展性强的 Serving SDK,能够更快集成自定义推理运行时。最初,它提供了灵便易用的推理 API,能更快构建 AI 利用。
- 更优:Adlik 能够将多种模型压缩、优化算法在实践中体现出杰出性能。面对异构的部署硬件,可能提供更优的端到端计划。并且可能依据不同的利用场景,实现更优的推理性能(如时延、吞吐量等)和更优的模型治理。
总结
随着企业对转型的需要日益强烈,转型过程中的 BI & AI 工具的抉择将变得尤为重要。本次流动所介绍的三个开源我的项目,很好的解决了企业转型过程中面临的诸多问题与挑战,各项目标具体技术细节欢送观看流动「视频回顾」理解。
同时,为了继续摸索企业智能化转型方法论、优质案例、最佳实际及撑持企业智能转型的开源技术,星策开源社区还将持续举办智能化转型相干流动,欢送关注此群。
星策开源社区 https://sourl.cn/TZ2Dy5
视频回顾
谭中意——BI&AI 帮忙实现企业数字化转型旅程的三个阶段
链接:https://www.bilibili.com/vide…
Andy——企业数字化转型,从大数据平台开始
链接:https://www.bilibili.com/vide…
卢冕——如何解决企业上线智能化利用的数据和特色挑战
链接:https://www.bilibili.com/vide…
袁丽雅——Adlik 让 AI 服务更省、更快、更优
链接:https://www.bilibili.com/vide…