关于时序数据库:AI时代已经到来不想被抛弃特别是传统产业的你怎么办

4次阅读

共计 3164 个字符,预计需要花费 8 分钟才能阅读完成。

因为 ChatGTP 的惊人体现,原本曾经趋于平淡的 AI,又火爆起来。毫无疑问,人类曾经进入了 AI 时代,AI 将渗入到各行各业,渗入到生存与工作的每个方面。这是一场新的工业革命,很多工作都将隐没,但也会产生很多新的机会,而新的机会肯定属于把握 AI 或会应用 AI 技术的人。

因为 TDengine 作为一款时序数据库(Time Series Database)次要用户群是传统工业用户,遍布制作、能源、化工、矿山、汽车等泛滥行业,因而我有机会接触很多这些畛域的客户,中国的、美国的,我都有很宽泛的交换。AI 的突飞猛进,让这些产业的人比 IT 人更加焦虑,每次交换,都会聊到 AI 的话题,怎么利用 AI 技术降低成本,进步传统产业的效率。

但通过我一年多的察看、思考,发现传统产业要能尽快、低成本、低危险的享受到 AI 的红利,还有很多坎要过,次要要看采取什么样的策略。周末有闲暇工夫,将本人的思考整理出来,分享给大家。

打消数据孤岛

AI 的根底是大数据,须要有足够的数据样本,能力训练模型,能力根据数据做出商业决策。然而对于传统产业而言,这个大数据的前提就不容易实现。

传统产业的 IT、OT 建设参差不齐,无论中国还是美国,大部分企业的数字化建设远落后于互联网类型的企业。以我最近打交道的美国发电企业为例,他们很多用的还是 PI System,而且还是很老版本的,Aveva 对 Process Book 都不反对了,但还在应用,因为 PI 相当稳固,而且能满足他们生产要求,他们也就没有更换的能源。但这个老零碎是齐全独立的,是一个数据孤岛。一个发电团体总有几十个甚至几百个电厂,每个电厂用的软件,或版本都很难统一。而且因为商业的并购、分拆的起因,导致各种零碎并存,各种软件供应商都有,而更换的老本与危险很高,因而很难对立。加上当初清洁能源的倒退,光伏、风力发电的零碎与传统的电力又不一样,因而复杂度更高。

在这种状况下要让 AI 赋能这些传统产业,首先要做的就是将分布各处的各种零碎、包含各种版本采集的数据进行汇总,打消数据孤岛。但因为各种零碎存在,有老掉牙的自动化零碎,也有最新的数采零碎,各种工业协定都存在,数据汇聚还不是简略的汇聚,还须要对各个数据源的数据进行荡涤、加工、解决,能力进入对立的平台。而每个数据源都不一样,因而数据汇聚是一个脏活、累活,还不产生间接的经济效益。然而数据汇聚如果不做,AI 赋能谈都不必谈。

建设数据分享平台

数据总是提供给各种利用,包含各种 AI 利用应用的,而且这些利用有外部,还有内部合作方的利用。比方新能源汽车采集大量的数据,它包含电机、电控、电池数据,甚至还有用户行为数据。这些数据不仅外部不同的部门须要应用,看如何通过数据分析晋升汽车品质,改善驾驶与乘车体验,同时泛滥第三方须要这些数据,比方电池供应商、电机供应商,他们也须要用这些数据来进行剖析,有些数据还要上报政府监管部门。因而如果不建设好弱小的数据分享平台,将无奈应答外部、内部以及监管部门的需要。

但分享就牵涉到数据的隐衷与平安问题,利益相干方应该只能看到它被答应看到的数据。比方电池供应商只应该获取脱去用户个人信息后的电池数据,而且只能看到本人的电池数据,还不能看到同一汽车主机厂其余电池供应商的数据。为了爱护隐衷,有的数据甚至要加工后能力提供,而不是间接提供原始数据。为进一步减少安全性,数据领有方还必须能随时管制利用拜访的时长,拜访的数据的时间段等。

大多数场景下,数据的分享能够是批的形式进行,定时获取一次就行。但有的场景是须要实时获取的,比方工业上总心愿做实时的异样检测。一旦检测到新的数据,就须要立刻告诉相干的利用。能够预感,实时的数据分享需要场景还会越来越多。

因为利用林林总总,新的利用、新的合作伙伴天天涌现,这个分享还必须有足够的灵活性。系统管理员收到开明分享的申请后,做个简略的配置,分享就能立刻失效,而无需进行开发或简单的配置。

因而企业要能让 AI 赋能,数据汇聚后,还必须建设有弱小、平安而又灵便的数据分享平台。

无缝对接的开放系统

数据汇聚后,企业当然能够开发本人的 AI 利用,做更好的异样监测,实时报警,并为产能、老本、设施保护等提供更好的预测,而且这些都是基于整个公司层面的数据做出的,而不是局限于一个电厂或一个制造厂,让决策者有更好的宏观整体把控。

但传统企业要组建本人的 AI 开发甚至数据分析团队,都是相当不容易的。因为 AI 开发以及数据分析的人才,还很稀缺,你须要与阿里、华为、腾讯、百度这些企业竞争,在美国,则是与谷歌、微软、苹果、亚马逊等竞争。不仅他们的薪资构造、工作形式与传统产业相差太大,而且即便退出,因为对产业自身的常识理解不够,往往半年甚至一年都难施展出作用,导致投入产出不成正比。

那么最好的形式就是间接采纳第三方的 AI 利用,将本人领有的数据平台与第三方 AI 利用对接。而且为缩短周期,能够间接应用对方提供的云服务,这样就大幅减小了购买或协调资源以及部署所须要的工夫,能够立刻上线。同时云服务个别是按时长或用量免费,而无需提前领取一大笔洽购费用。这样能很快看到成果,看是否能满足要求,大幅升高了决策老本。

但 AI 利用提供方很多家,服务质量也参差不齐,那么作为领有数据的企业,要做到的就是保障本人数据平台的开放性,任何利用都能够通过规范的接口获取数据,这样就能去除 AI 利用与数据平台对接的阻碍,各种利用零碎都能与数据平台无缝对接。只有想尝试某个 AI 利用,一周甚至一天之内就能够看到成果,大幅提高决策效率。因而如果数据平台具备很好的开放性,那么让 AI 赋能,就像商场买衣服一样,能够左挑右拣,直到本人称心为止,不是苦楚,而是一件赏心悦目的事件。

个别的平台或软件都会宣称本人是凋谢的。但从我集体的教训来看,只有风行的用户量大的软件或零碎,开放性才不会有问题,而且所有的利用都会与它对接。就像咱们开发的 TDengine,因为开源,装置量曾经超过 27 万,而且它还有规范的 JDBC 接口,反对 SQL,能与简直所有的可视化、BI 工具对接。

AI 的将来

与互联网一样,AI 并不能取代传统产业,能源、制作、汽车、矿山这些行业仍旧存在,但 AI 能赋能、晋升这些产业,进步生产效率,为传统产业注入新的生机。不拥抱 AI 的企业将会失去竞争力,逐渐被淘汰。

AI 曾经弱小,但对于传统产业而言,还有两个有余。一是要求的算力过大,导致老本过高,对于利润很低的传统产业,难以承受。另外一方面,当初的 ChatGPT,依赖的都是历史数据,而工业场景,更须要的是对实时数据的剖析。因而 AI 在工业场景还有很多挑战以及晋升的空间,但这个挑战应该交给 AI 的钻研人员。

传统产业要做的是,将散布于各地的数据汇聚起来,建设一个凋谢的、能够平安、灵便共享的数据平台,能与泛滥的第三方的 AI 工具或服务无缝集成,在无需大量的资金和人力投入下,在简直没有决策危险的前提下,能迅速验证并享受 AI 带来的红利。

以我本人为例,我本人开办的 TDengine 是一个专为物联网、工业互联网定制的大数据平台。TDengine 不是以 AI 为核心技术的公司,但在 AI 的时代,咱们的惟一抉择就是全面拥抱 AI。为帮忙泛滥的传统产业数字化转型、能让 AI 赋能,过来的一年,咱们投入了微小的人力反对开发 PI System, MQTT, OPC 等各种工业数据接口,反对与各种 BI、AI 工具对接,而且在阿里云、AWS、Azure、GCP 上推出全托管的云服务。无需大量资金投入、无决策危险下,短时间内你就能够试用开明,并与 AI 利用、泛滥的剖析工具、可视化工具集成,体验大数据以及 AI 的魅力。

“Run! Don’t walk. You are either running for food or running from being food!”。咱们唯有奔跑,能力不被 AI 时代摈弃。

陶建辉
2023 年 6 月 3 日于加州湾区

正文完
 0