乐趣区

关于存储:如何帮用户管好云账本阿里云数据库助力收钱吧

简介:“收钱吧到账 100 万”成为一般商家最想听到的声音。

你有多久没摸过现金了?

中国互联网络信息中心公布的第 47 次《中国互联网络倒退情况统计报告》数据显示,截至 2020 年 12 月,我国挪动领取用户规模达到 8.54 亿;中国人民银行公布的数据显示,截止到 2020 年年底,我国挪动领取业务 1232.20 亿笔,金额 432.16 万亿元。

这些数据与咱们每个人都非亲非故,下班路上的早餐、小区里的停车费、假日的一场电影、深夜小吃摊上的一份夜宵……挪动领取早已成为社会的重要基础设施,组成了大街小巷的人间烟火气,你也肯定听过机器收回的 “收钱吧到账 X 元” 的声音。

收钱吧成立于 2013 年,是聚合领取行业的开创者,目前已渗入百万线下商家,为数亿民众赋能。

随着挪动领取的逐渐成熟,收钱吧积淀了大量的门店交易数据。收钱吧将这些数据高效利用,面向商家推出挪动领取收款、营销管理软件、广告、供应链、共享充电宝、商家社区等服务。现在,收钱吧曾经从晚期的聚合领取服务商,倒退成为数字化门店综合服务商,让百万级的中小型商家实现了最根底的数字化转型。

面对千亿级别的数据量,以及每天超过 3200 万笔交易的数据增量,收钱吧如何实现海量存储和账单查问?让咱们一起走进收钱吧,去摸索背地的故事吧。

以下为「超级探访」第四期——《阿里云数据库助力收钱吧,如何帮数亿用户管好账本?》的节选对白。

1.帮数亿用户管好账本

张一甲:收钱吧目前服务多少商户、用户的规模有多少?

收钱吧 CTO/ 高级副总裁常建龙:收钱吧服务网络曾经笼罩中国境内 660 个城市,服务 400 万线下实体商家,日均服务 3200 万人次,累计服务 200 亿人次,从集体消费者到夫妻店到国内连锁品牌,都能看到收钱吧的身影。

张一甲:如何存储和治理因而产生的海量账单呢?

* 毛宇 - 收钱吧开发总监:* 这要抓住两个要害。首先须要一个集中存储和治理领取账单的数据中心。

其次,收钱吧笼罩了不同的客户类型,咱们须要想方法满足不同用户的差异化需要。

因而,收钱吧自主研发了分级账户零碎,可具体统计各品牌、各分店、各收银员收款数据,清晰记录每一笔账目,并可依据财务要求定制对账单,解决客户关怀的痛点问题。

张一甲:领取是一个很敏感的业务,商家和消费者都十分关怀本人账本。收钱吧如何保障用户的财产平安,解决用户的后顾之忧?

* 毛宇 - 收钱吧开发总监:* 针对财产平安,收钱吧强调的是治理和掌控,老板不必到店也能把握详情——近程管账、管店、管人。收钱吧 APP 提供日账单、月账单和所有收款记录,不便对账。APP 随时随地查看所有交易信息,收银员、老板都不便。

张一甲:在研发这个零碎时遇到的最大挑战是什么?

* 毛宇 - 收钱吧开发总监:* 次要挑战有三个,第一是存储可靠性,第二是存储老本,第三是海量数据下的多维组合实时查问。

存储可靠性毫无疑问十分重要。试想如果账单失落,客户的帐单、银行的帐单、商家的帐单等齐全无奈核查和查问,这是不可承受的。

对于存储老本,咱们目前曾经存储了千亿级别的数据,每日新增 3200 万数据,这个数据增量十分大,对存储老本的挑战也十分大。

此外,不同的客户有不同维度的数据查问需要。B 端的查问量绝对较小,但查问维度简单;C 端用户的查问量比拟大,但业务逻辑绝对简略。

对于连锁商家,须要反对品牌、门店、收银员、工夫等多个维度的随机组合查问;对于消费者,须要反对基于工夫范畴的账单查问。通过总结,收钱吧须要反对 30+ 维度的随机组合查问,能力满足目前多品种用户的查问需要。

张一甲:收钱吧怎么解决这些问题?

* 毛宇 - 收钱吧开发总监 通过大量的调研、剖析和测试验证,比照了不同的技术和产品,咱们最终抉择应用 阿里云的云原生多模数据库 Lindorm* 作为存储核心来构建整套账单零碎,零碎目前曾经上线运行 1 年多。

抉择 Lindorm 次要有三点考量:Lindorm 基于多正本技术,提供 99.99999999% 的数据可靠性,一共 10 个 9;

Lindorm 具备最大 10:1 的压缩比,再联合冷热拆散能力,将 6 个月前的历史账单转化为冷数据进行存储,综合存储老本降落 2 /3;

Lindorm 提供了一体化的账单检索计划,能主动针对账单数据创立适合的索引,反对 30 多个维度随机组合的实时查问。

张一甲: 6 个月前的历史账单被高度压缩了,还能够被检索到?

* 毛宇 - 收钱吧开发总监:* 是的。有了阿里云 Lindorm 的保障,海量存储与实时查问,不再是矛盾。

2.海量数据辅助停工决策

张一甲:2020 年因为疫情,线下门店都或多或少遇到了经营的艰难,收钱吧作为服务线下商家的企业,给商家提供了哪些帮忙呢?

毛宇 - 收钱吧开发总监:收钱吧致力于用网络和数据力量帮忙线下商家经营生意,基于领取后产生的原生流量,推出了《全国线下商业生产指数的追踪数据》,能实时反馈线下商业生产的活跃度。

这个数据一方面提供给政府,辅助政府制订反对中小微企业停工复产的政策;另一方面凋谢给咱们的宽广商家用户,帮忙商家无效地制订正当的停工打算。

张一甲:这个指数是怎么计算出来的,如何保证数据的准确性和实时性?

毛宇 - 收钱吧开发总监:收钱吧的业务笼罩线下生产的各行各业,咱们基于存储在 Lindorm 中的海量生产数据,依据肯定的经济计量模型,实时计算失去商业生产指数。

张一甲:Lindorm 仍然在这个零碎里施展了重要作用?

毛宇 - 收钱吧开发总监:是的,整个零碎的存储和计算都是围绕 Lindorm 来构建的。咱们的所有数据都存储在 Lindorm 上,基于它提供的存储计算一体化计划,能轻松对接计算生态,帮忙咱们疾速构建出一套数据处理架构,反对应用服务上线。

Lindorm 同时提供了 kv 构造的宽表存储,兼容 HDFS 文件存储,SQL 查问和数据检索性能,咱们的源数据、维表都存储在 Lindorm 上,计算失去的后果表也写回到 Lindorm 中提供给下层业务查问应用。无效防止数据迁徙,简化零碎架构。

基于 Lindorm 构建的这套计划,开发上线工夫比预计缩短了一半。

3.数字时代想致富,做好数据库

张一甲:2020 年阿里云公布了 Lindorm,它有什么特点?

阿里云智能资深技术专家 /Lindorm 研发负责人沈春辉:Lindorm 是阿里云公布的第一款自主研发的 NoSQL 产品,基于存储计算拆散、多模共享交融的云原生架构,反对海量数据的低成本存储解决,反对丰盛的数据检索能力,反对一键对接计算生态,进行交互式、批处理、流解决等计算解决,帮忙用户疾速构建出一套数据处理架构,在互联网、物联网场景中处于刚需。

同时,Lindorm 尽管是自主研发,但十分动摇地拥抱开源生态,数据拜访接口反对 SQL、HDFS、HBase、CQL、OpenTSDB 等开源规范,简略易用,无需额定的学习老本。

张一甲:阿里自主研发的数据库是出于本身电商业务的需要,从自有业务到 to B 服务,阿里云如何放弃对需要的敏锐洞察?

阿里云智能资深技术专家 /Lindorm 研发负责人沈春辉:从用户中来,到用户中去,这是产品继续迭代的不变逻辑。在 to B 服务过程中,除了稳定性、老本诉求之外,咱们比拟难听到客户间接通知你要什么,这是一个很大的挑战。而数据库间接连贯业务,其需要是大量存在的。

为此,咱们次要借助两个形式:一个是实地走访。数据库部门有一支专家服务团队,会定期访问客户进行业务技术交换,及时理解产品的应用状况和诉求,探讨近程沟通与协同的效率优化计划;

另一个是趋势预判,包含行业趋势、技术趋势。比方 Lindorm 在物联网方向预投了很多技术研发,指标是数量级地晋升终端设备的时序数据、地位数据的解决效率,存在肯定的提前预测性,同时会随同行业倒退与利用反馈做适时调整。

版权申明:本文内容由阿里云实名注册用户自发奉献,版权归原作者所有,阿里云开发者社区不领有其著作权,亦不承当相应法律责任。具体规定请查看《阿里云开发者社区用户服务协定》和《阿里云开发者社区知识产权爱护指引》。如果您发现本社区中有涉嫌剽窃的内容,填写侵权投诉表单进行举报,一经查实,本社区将立即删除涉嫌侵权内容。

退出移动版