关于api:结合-API-DaaS让使用数据更方便

5次阅读

共计 5096 个字符,预计需要花费 13 分钟才能阅读完成。

Eotalk 是由 Eolink CEO 刘昊臻发动的泛技术聊天流动,每期都会邀请一些技术圈内的大牛聊聊天,聊些对于技术、守业工作、投融资等热点话题。

Eotalk 的第 3 期,很快乐邀请到 Tapdata CEO TJ 唐建法,TJ 能够说是一位超级大咖,因为他之前作为 MongoDB 大中华区的首席架构师,以及 MongoDB 中文社区的主席,被整个圈子外面人所熟知。

明天 TJ 以一个比拟新的身份:Tapdata 的创始人和 CEO 来加入咱们这次 Eotalk,和大家聊一下 DaaS 和 API 相干的一些故事。

什么是数据孤岛? 对企业和 IT 团队有什么影响?

TJ: 数据孤岛这个景象始终都有,然而最近几年大家讲的比拟多的一个词叫做数字化转型。这外面其实波及到方方面面,然而最底层的都离不开上面的一些数据须要买通。

这个时候会发现大家的数据其实是在各个孤立的零碎之内的。回到二三十年前,企业最开始的时候做的事件都叫信息化,从人工手动到变成自动化,建零碎把人工流程用程序的形式把它自动化起来。

比拟典型的就是做 ERP、订单零碎、HR 零碎、财务零碎等。财务最开始用 Excel,当初有专门的金蝶、用友这样的财务零碎。

这些都是叫做信息化建设,它的特点就是每一次立项建零碎的时候,都有十分明确的业务指标。

比方咱们要上一套新的业务流程治理或者洽购零碎,基本上会有一个前端、后端、数据库,差不多是三层架构,造成十分独立的自我运行的一套业务零碎。这个状况就是随着从 30 年前开始,始终到当初。你能够设想失去企业积攒了多少像这样多的零碎,略微有规模的企业根本有四五百套独立零碎。中国一个三甲医院,它的均匀数量是 250 多套这样的业务零碎。比方是像一个教育零碎,那它可能就有几十套。制作行业的话,也是有上百套这样的业务零碎。

这些都是咱们所谓的信息系统,之前不叫孤岛。但什么时候开始叫孤岛了呢?当咱们心愿对数据做洞察,理解咱们的客户到底怎么样在用咱们的产品,咱们的生产流程到底哪里会有问题,咱们整个所有的业务放在一起会是什么样的一个状况等等。须要做数据分析的事件时,你会发现你的数据其实都是在不同的业务零碎外面的,做一个上报数据都要花几周,甚至还不肯定拿失去。

这时你就会发现,我的数据其实都是在被孤立在每一个本人的后盾的数据库外面。此时数据孤岛就呈现了。

还有就是做一些新的业务场景,我想把数据给到我的业务用户去应用,都是会波及到这个所谓的数据孤岛的问题。那咱们就是试图在这样的一个大环境下,可能给企业提供一个更好的形式,来帮忙他们把数据给用起来。

回到 Tapdata 取名的由来,咱们是一个水管工,咱们 Make your date on tap。Tap 这个单词,大家晓得就是水龙头,因为我比拟喜爱喝扎啤,一拧水龙头就来了。

咱们的使命就是进到企业外面,帮他们把这些孤岛零碎用咱们的超级水管连接起来。当你想要用这个数据的时候,就像自来水一样,把它给拧开来就能够用了。

刘昊臻: 了解,我的感触还很深的,毕竟咱们都作为 CEO。会看到公司外面其实有十分多的零碎,我想把它连接起来的时候就会发现,零碎尽管提供了很多的性能或很多的接口,然而它要买通的起来其实没有那么简略,底层的一些数据库它是离开的。

可能在很久之前,大家还没有太多所谓叫数据孤岛的概念。因为那个时候你不太须要把它连起来。但当初即便不是特地大的公司都曾经有十分多的数据库要连起来。这个时候数据孤岛的问题就很重大了。

包含咱们 Eolink 的用户也偶然问咱们,是否帮忙他们将 API 对接起来,为业务赋能。

所以如果有一个大水管可能把所有货色全副连接起来,以规范的形式来对外输入,可能把各种零碎串起来,这对整个公司来讲的话,我感觉是十分不错的一个解决方案。

目前解决数据孤岛有什么计划?

TJ: 数据连贯是个老问题了,只不过当初需要会越来越显著,所以须要用更新的形式。

以前如果咱们要去零碎外面取数据,DBA 会说业务零碎不能轻易操作,须要提供一个 API 来对接取数据,但这个过程须要开发写代码、测试和上线,周期会比拟长。当需要缓缓多起来的时候,这就会变成一个不太难受的事件,因为生成一些数据 API 的工作很繁琐,也没有什么特地大的业务价值。

所以大家就换了一种思路,通过工具把数据都定时拿到一个中央,像 ERP 每天晚上都会开明一个时间段去抽取数据,白天的话你就等等。

这外面就会波及到一个数据实效性的问题,比方像核酸数据,晚期你做完核酸当前,数据会分批上报给国家平台、省平台,当别的省须要用的时候,就是要 48 小时、72 小时之后,这就导致效率很低。所以第二种形式也解决不了实质性的问题。

之后就呈现了第三代产品,用一些 MQ 或者 Kafka 做数据的连贯。但它的要求是你本人要把数据放给到 Kafka,没方法主动把数据传上去,因而应用老本还是比拟高,而且运维 Kafka 也不是一个小老本的事件。

Tapdata 心愿解决让用户不须要开发也能够实时获取数据,并且须要简略易用。因而推出 DaaS 的概念, 通过一种主动获取数据的能力,把它地方化集中到一个平台,配上我的自动化的低代码的 API 生成、反向推送等性能,用户不须要了解底层有多少链路、数据模型、数据库格局等,是 Oracle、DB2 还是 MySQL,你只有关注数据的层面。

刘昊臻: 所以像 Tapdata 这样第四代的产品,能够用一个对立的平台,可能疾速接入各种数据源,可能在一个界面上把各种数据源做一些像数据的编排,或者是解决再输入成你想要的 API。我感觉这个是一个十分吸引人的点,毕竟企业外部之间的数据买通确实是十分麻烦的事件。

DaaS 和 SAAS 的概念其实很像,把数据作为一种服务,关注如何应用数据,而不是软件自身。DaaS 和 API 是相辅相成的关系,就是 DaaS 通过疾速获取和封装数据,将数据变成输入成 API 不便后续对接。

DaaS 的数据中台的关系?

TJ: 我认为数据中台的字面定义,跟咱们实际上看到的数据中台厂商做的事件还是有一些差别的。

目前大部分的供应商在做的事件是一个帮忙企业在做数字化的降级。在此之前,企业的数据能力是比拟根底的,或者是没有的,基本上都是一些业务零碎、信息系统。

通过数据中台这种模式把数据进行集中化治理,造成一个无效的数据级别的资产,提供给上游的各种业务,次要集中在做营销,打标签,做剖析,BI 这些支流的场景。数据中台是一种架构模式,是指的是对企业各种业务零碎数据进行集中化当前,在这过程核心治理完了交付给上游业务应用的这一个整个的事件。

而 Tapdata 则比拟强调工具属性,Tapdata 就是一个十分纯正的标准化的一个产品。你能够用它来帮忙你搭建数据中台, 咱们的工具跟其余的工具相较比起来, 或者跟绝大部分的数据中台的产品能力比起来,会十分关注全链路实时能力。

咱们从数据采集开始到数据处理,数据加工到服务,采纳的一整套技术栈都是十分强调实效性数据的,这样我可能保证数据到了这个地方化平台外面。服务的业务场景会是个选集,而非只是偏离线数据的一个场景。

刘昊臻: 我在业内看到了很多做数据中台产品的公司,最初都做成了有点像我的项目型公司,在标准化产品方面的能力会偏弱一些。咱们的用户,他可能间接面向的是咱们的 IT 团队,是面向于开发者,面向的数据部门。咱们给到你的是一个更加标准化,更加灵便,可扩大的一种解决方案。

TJ: 是的,从咱们的愿景来说,咱们是要做一个很长期的 Business。从企业服务的角度上来说,咱们置信将来必定是各种分工精细化的。必定是每一个环节都是有一个专门的、专攻的、做的十分精湛的供应商。

海内为什么没有数据中台这样的我的项目,连大数据这样的事件都消缓缓沦亡,越来越少。就是因为海内比拟多的就是各种搭积木一样的,每一个能力它都有几个做的不错的供应商在那里能够选用。配合起来一个比拟残缺的生态把这事件给做了,但国内就处于比拟晚期的阶段。

企业的数字化水平太低了,团队能力也参差不齐,没方法驾驭这些工具,只能是心愿供应商可能提供一揽子计划。

是否举例介绍一下,目前企业应用 Tapdata 的成果?

TJ : 咱们当初大量的大数据平台,绝大部分先做采集数据,采集入库、入仓、入湖。他们基本上会写一些脚本定期执行,每天晚上把数据拿过去,而后开启一系列的批量的解决的工作,对这些数据进行加工。常见的工作,比方会对咱们的客户从新打标签,这些客户是不是我的 VIP 还是 VVIP。

但这个过程实效性很差,我举几个客户的例子。比如说一个快递公司,他们在做一个新的业务零碎,叫运单管理系统,然而数据之前是存在各种第三方零碎,因而会每三个小时同步一次运单进度。

大家能够设想一下,我刚刚把这个货单给了,然而三个小时之后才晓得状态是否被揽收。但当初客户要的是分钟级的数据,传统形式就给不到。

咱们有另外一个零售商的客户,百年老店,曾经有十几套不同的业务零碎,不同的门店、地区都是卖的相似的货色,然而有不同的业务零碎在撑持。因为历史起因,他有很多套雷同相似的零碎,在做相似的业务。每天晚上它会有 BI 零碎,把所有的数据汇总过去,做一些业务的报表。

然而他解决不了什么问题呢,比方有个客户走到门店想晓得我这个戒指有没有货?他这个时候只能看我本人的零碎外面有没有,其余门店有没有是不晓得的。

互联网公司没这个问题,因为一开始就是一套云架构,不存在数据孤立问题。但对很多传统厂商来说,这种数据孤立十分常见,他们真的没方法晓得这些数据。

数据中台也能够帮他们做把这些数据汇总到他的中台外面,提供 API 让他去查问,但查问的是昨天的库存。如果你须要实时库存,原有的那些中台是没法实现的。

这个是 Tapdata 的场景,就是咱们把数据会从各个系业务零碎把它抓过去。然而抓的形式就是那边有一个单下了,库存改了一下,我这边就曾经间接一秒之内就曾经到了咱们的中台外面,而且你 API 去调的时候马上就能够获取到最新的数据。

Tapdata 为何抉择当初开源?

刘昊臻: 你之前是在 MongoDB,始终在做开源。为什么 Tapdata 没有一开始就抉择开源的形式,而先走商业化,而后在时机成熟的时候,再抉择在当初这个工夫点来开源,你是怎么去思考这个事件呢?

TJ: 首先是我要想好怎么开源,毕竟做公司不是个人爱好,我想做成一个产品让用户用,我认为一个繁难规范是有客户付费,你付费的货色才是正儿八经的在发明价值,否则就是一个 Hobby,就是个喜好,大家玩一玩。

第二是我感觉开源软件太多了,很多公司为了开源而开源。反过来我想给大家一个真的有价值的货色,再来大家来一起来共创。我心愿先跑出一些问题来确认一下,再来做开源,我心愿给社区的是一个真的是初步验证过的产品,也是一个开源老兵的责任。

咱们都是做创业者的,很辛苦,真的压力十分大。像 Eolink 和 Tapdata 是工具软件,或者是基础架构软件当初不靠开源是很难涉及到用户。

刘昊臻: 是的,Eolink 其实是 16 年的时候就先做的开源,而后 17 年才成立的公司。前面咱们发现要把产品打磨的足够好,必须要获取到商业反对,后续才可能有更多的精力投入在开源方面。所以咱们从新思考要从新做一个开源的 API 产品会是什么样的一个状态,它能不能够去引领行业潮流,或者说在将来有一个比拟好的倒退空间。

我感觉这个是一个负责的态度,尤其是把通过企业验证的,客户验证的货色,放到开源社区外面去,让更多的开源开发者,让更多的中小客户可能去享受到这个福利。

像咱们新的开源 API 治理产品 Eoapi 和网关产品 Apinto,咱们也保护了几个月,当初陆陆续续有贡献者退出进来,比如说帮忙咱们的网关去做界面,帮忙咱们去承当某一块性能的开发,或者给予新的 idea。

Eolink 和 Tapdata 的单干瞻望?

刘昊臻: Tapdata 和 Eolink 有十分多能够相互联合的中央。比方:

  1. Tapdata 自身作为一个十分实时的一个数据源,那它是能够把各种的数据间接做整合,而后解决输入 API。能够和各种网关联合。生产进去的这些数据可能间接对外提供,由网关负责保障 API 的调用平安以及做各种日志监控等事件。
  2. Tapdata 下面所生成进去的这些 API,能够公布到 Eolink 的 API 治理产品里,让开发者能够更好地治理、对接和测试这些 API。

TJ: 没问题,这也是将来的趋势,产品之间有更多的单干,让用户有更好地应用体验。

刘昊臻: 好的,咱们明天先聊到这,感激 TJ 和 Tapdata 的反对,大家再见。

Eotalk 往期举荐 ⭐⭐⭐⭐⭐:

【Eotalk Vol.02】从极客到 CEO,开发者如何晋升技术领导力?|甘果科技的 CEO 老甘(路文杰)

【Eotalk Vol.01】Eoapi,咱们心愿以开源的形式构建 API 生态系统| Eoapi 的外围开发者秦圆圆

正文完
 0