简介:本次分享介绍客如云如何利用阿里云大数据产品来建设数据中台。客如云是 2012 年成立的一家公司,笼罩餐饮、批发、美业,还有其余的业态以及服务的一家综合性的 SaaS 公司。到 2020 年为止,客如云曾经服务了 60 万商家,帮忙 60 万商家实现了数字化、智能化的革新,接下来咱们会笼罩更多的商家。
客如云技术总监 李浩
本次分享介绍客如云如何利用阿里云大数据产品来建设数据中台。
客如云是 2012 年成立的一家公司,笼罩餐饮、批发、美业,还有其余的业态以及服务的一家综合性的 SaaS 公司。到 2020 年为止,客如云曾经服务了 60 万商家,帮忙 60 万商家实现了数字化、智能化的革新,接下来咱们会笼罩更多的商家。
目前客如云是四核心的架构,咱们的研发核心在成都,硬件研发核心在深圳,总部在北京,销售核心在武汉。接下来次要介绍咱们的业务范围:客如云是以软硬一体的 SaaS 收银服务为外围的,所以 SaaS 收银零碎的硬件和软件是咱们第一层,是咱们的效率工具。第二层,咱们和餐饮、批发的友商企业一起打造的人、财、物、客的生态系统。第三层,咱们利用增值服务,比方营销、供应链、人效、商业智能、金融服务,还有大数据的利用,去满足各层级的商家的需要。从 S1 到 S5,所有的大小品牌咱们是全笼罩的。咱们的愿景是帮忙客户,帮忙商家实现店开天下,客如云来,而咱们从中可能更好的服务于商家,帮忙商家提效降本,去取得更多的营收,升高更多的老本。
目前客如云整体的零碎全副建设在阿里云的服务之上,保障了在较少的资源的状况下,撑持咱们当初成为平台级的公司。
接下来介绍一下,咱们如何利用阿里云的产品来进行数据中台建设的。大家都晓得阿里巴巴的数据中台是 3 个 One 的外围,One ID,One Data,One Service。在基础设施的欠缺之上,首先咱们要做到数据集成,所以咱们利用了阿里云的 DataHub、DataWorks、DTS 等产品,把咱们的业务数据对立到咱们的 Hadoop 集群外面,而后咱们当初再迁徙到咱们的 MaxCompute 外面,利用大数据的产品来进行整个数据仓库的建设。MaxCompute 帮忙咱们实现了整个离线数据的计算和存储,包含数仓空间的建设,而后咱们利用 PAI 建设了咱们的算法核心和机器学习的样板,利用 Flink 的技术打造了实时计算的平台。咱们在这些实时计算和离线计算的根底之上,建设了对立的查问服务。利用阿里云的 Hologres 产品,实现了咱们的一体式查问的 One Service 的理念。
在这个根底上,咱们保障了咱们整个的数据利用,蕴含咱们外部的数据利用,BI 的产品,还有内部的数据利用,大屏,还有报表,还有整个的算法,智能举荐、精准营销等这块的整个的实现,建设了咱们客如云的数据中台,而后疾速的满足了咱们的外部用户和内部用户的数据需要。
接下来咱们再讲一下,在这个过程中,咱们如何利用阿里云的产品来帮忙解决咱们的哪些痛点问题?
首先咱们看到的是咱们原先是自建的 Hadoop 集群,难以保护,因为老本很高。咱们通过了一年的致力,把整个 Hadoop 集群换成了 MaxCompute,这样的成果很显著,咱们的运维老本升高了 1 倍,计算速度减少了 8 倍,保障了咱们疾速交付 ETL 等计算解决的能力,给到业务线来应用。
第二个问题,咱们遇到了很多数据安全的问题,自建的 Hadoop 集群没方法做数据审计,所以咱们用到了阿里云的敏感数据爱护产品 SDDP,来进行数据的分级分类,爱护咱们的产品,实现数据的零透露。同时咱们自建的 Presto 集群做交互式查问时和咱们的 MaxCompute 又不能互相交融,咱们调研了当前发现 Hologres 的产品,绝对来讲比 Presto 性能更好一些,所以咱们用 Hologres 的产品代替了 Presto,保障了咱们能够间接从 MaxCompute 里查问,使整个交互实现了无缝对接。接着咱们遇到了一些数据模型,数据建模的产品,目前还在调研 Dataphin 产品,实现整个的数据模型的建设。
咱们最大的痛点是实时大屏的性能问题,这个时候咱们发现用 Flink 的技术,再加上 QuickBI 能解决咱们的前端和后端的问题。接下来咱们以实时大屏为外围,来介绍一下咱们怎么样利用的,而后怎么样解决掉这个问题的。
数据大屏咱们遇到的难点第一个是咱们的数据源太多了,咱们用到了 MySQL、RDS、MongoDB、Redis、ES 等多种数据起源,咱们要把这些数据起源对立的汇聚,解决掉咱们的数据源多的问题。第二个是咱们的大屏性能方面,当初咱们数据量特地大,而后款式又特地多,需要特地简单,这个时候怎么样去解决掉这个问题。接着是看到这些需要,生成这些数据后,如何疾速的在前端展现,这也是一个很大的问题。所以咱们在调研 QuickBI 产品的时候,发现的确是可能解决咱们这方面的问题。
咱们再来看一下咱们是如何解决掉问题的。第一个问题,咱们其实次要还是要做数据的治理,源数据的治理,血缘关系,甚至是一些多数据源的解决,缩小咱们的现有的集群。第二个问题,因为数据量大,当初各类企业其实有着海量的数据,须要解决疾速查问的问题,计划就是咱们利用阿里云的实时计算平台,基于 Flink 开源技术,解决了咱们整个的查数据速度的问题。我认为整个的阿里云的 Flink 技术的确是可能更快的查问到想查问的海量的数据,它的性能和高扩展性咱们的确是失去了体验,我感觉在这块畛域阿里云还是名列第一的。而在整个大数据前端这块,咱们发现的问题是渲染慢。然而咱们用 QuickBI 自定义拖拽,疾速地去定义数据源,导入到不同的框标外面,能够疾速的查问进去。
下面是解决了一些问题,接下来介绍客如云的实时计算平台是怎么样的架构。咱们通过 4 个层,根底数据层,实时计算层、接口层和展现层来架设咱们的实时计算平台。重点讲一下咱们的实时计算层,计算层这块其实咱们有一些需要,不单是当天的数据,比如说商家要看这个月当初为止咱们的营业额是多少,他岂但须要当天的数据,还须要从 8 月 1 号到当初为止,所有的数据。所以它会体现到咱们岂但要有流表的接入,还要有维表的接入,还要有聚合计算,从而造成了一个数据流。多流的汇聚,实现了咱们在接口层的调用的状况下,展现层可能展现到咱们当天能满足商家每个维度的需要的数据,就像我举的那个例子一样,可能看到当月到当初为止它的营业额是多少,这样的一个场景。所以说咱们实时计算的平台次要是为了满足业务各方面的需要。
接下来分享一下理论利用的场景。咱们曾经帮着一些菜市场实现了数据大屏。这块的展现次要是当天的销量是什么,哪个销量最好,这样可能帮忙商家理解第二天进什么货更适合。这个大屏的利用实际上曾经是可能帮忙商家在理论的生存场景外面失去很好的体验。
餐饮实时大屏是基于咱们现有的数据,展现了一下咱们中国餐饮大数据的一些状况,但这是只是代表一部分客人的数据。当然这外面能够说客人的规模越来越大,咱们做的也会越来越好,咱们就能够展现进去到底中国人民喜爱点什么菜,哪个菜是最好吃的,大家喜爱什么样的口味,咱们都能够通过咱们的实时数据计算,通过数据挖掘来发现进去。
BI 利用次要是为外部客户应用,咱们的经营团队、销售团队、研发团队还有其余团队,可能保障咱们整个的在数据的剖析经营和辅助决策外面起到很大的作用,节俭很多的管理层的老本和工夫。利用咱们的 BI 产品,能够解决这样的需要。
总结一下次要介绍的三点,一个是客如云是干什么的?客如云是要帮忙咱们的餐饮、批发、美业的商家,实现店开天下、客如云来的愿景的 SaaS 公司。第二点是客如云如何利用阿里云的大数据产品来建设客如云的数据中台。第三点是客如云如何利用实时大屏、咱们的商家画像产品以及其余大数据利用产品,来赋能商家。
原文链接
本文为阿里云原创内容,未经容许不得转载。