本文介绍了厦门笛卡尔数据(AmzTrends)在面临数据存储挑战时,抉择将其数据分析服务迁徙到 TiDB Serverless 的思路和实际。通过全托管的数据库服务,AmzTrends 实现了全局老本升高 80% 的成果,同时也充沛展现了 TiDB Serverless 在简化架构、晋升性能和降低成本方面的劣势。将来,AmzTrends 打算持续利用 TiDB Serverless 的劣势,扩大业务并晋升竞争力。
厦门笛卡尔数据是一家专一于跨境电商数据分析的 SaaS 公司,AmzTrends 为亚马逊卖家提供品牌剖析 (ABA)、商机探测以及广告数据的可视化剖析。目前,AmzTrends 次要以 SAAS 和 Chrome、紫鸟浏览器的插件模式为客户提供数据服务,以订阅模式为美国、日本、中国数万计的跨境电商卖家进步数据服务,帮忙卖家在选品、经营、广告等经营环节提供业余的数据分析决策价值。
业务挑战
AmzTrends 的数据次要以大单表的模式进行存储,最大的表数据量超过 22 亿,字段较多且某些字段很长的大宽表,单表中存在结构化与非结构化的数据结构,因而须要建设大量的索引,占用大量存储空间,而且过期数据还须要定期清理,常常应用 BATCH 进行批量操作,一旦遇到异样无奈无奈事务的一致性,因而数据保护压力微小。
技术痛点
在业务初期,AmzTrends 抉择了在百度云上自建 TiDB 集群,资源按月付费。集群规模蕴含 1 个 TiDB 节点、1 个 PD 节点(此种部署形式会侵害 PD 的高可用性,为了节约老本的部署形式,是官网不举荐的高风险计划)、3 个 TiKV 节点,技术人员通过将亚马逊下载的原始 CSV 格局的数据批量写入到 TiDB 中进行数据分析。此外还独自配置了 3 台服务器部署 Spark,进行全量简单的数据计算剖析。但 Spark SQL 与关系型数据库不同,须要专人运维,简单的业务架构造成了资源冗余,使得运维老本较高。
因为集群配置不够加上业余运维团队的缺失,弃用了 Spark,大量简单且数据计算量微小的工作由 Spark 转到 TiDB 间接运行,集群越来越不稳固,数据安全面临重大挑战。在这种状况下,AmzTrends 不得不寻找对技术要求更低且更平安的运维解决方案。在接触到 TiDB Serverless 后,AmzTrends 认为因为都是 TiDB 产品体系,全托管的一栈式数据库服务 TiDB Serverless 不仅能够充分发挥 TiDB 数据库原有的个性和劣势,还能够帮忙公司简化架构,晋升零碎的整体性能和健壮性。所以,AmzTrends 决定将整体利用从百度云部署计划迁入 TIDB Serverless,不仅危险更低且兼容性和性能都能失去无效保障,另外通过数据容量与申请量的老本预估,AmzTrends 发现迁徙后老本能比现有的云服务器部署更低,因而有了这样一次充斥挑战的数据迁徙过程。
为什么抉择 TiDB Serverless?
TiDB Serverless 是一种全托管的、自动化的数据库服务(DBaaS),可能疾速部署集群,并按理论应用资源量计费。联合本身业务架构个性,AmzTrends 在思考 TiDB Serverless 时重点关注以下个性:
● 轻松扩大基础设施,按理论使用量付费 :商家只有在工作日工夫才会应用 AmzTrends 的数据分析服务,而传统的云模式须要为预估的最大流量付费,容易造成闲时资源节约。TiDB Serverless 能够秒级搭建起数据库环境,用户只需为理论的数据处理和存储付费,这让 AmzTrends 开发团队可能更专一于翻新和倒退。
● 轻松上手,无需手动分片 :以前,AmzTrends 的 20 亿数据须要定期进行清理或者分片,利用 TiDB Serverless 能够帮忙用户解脱数据分片等数据库繁琐的操作工作,相当于只保护一张大表即可,既能够满足更长时间维度的查问需要,又无需重复对数据进行整顿操作。
● 主动伸缩,老本效益显著 :无论是存储、事务处理还是剖析工作负载,AmzTrends 都能在几秒内依据利用需要主动伸缩,防止造成资源冗余节约,既灵便又经济。
● 全面托管,无感运维 :为 AmzTrends 提供最优化的 TiDB 部署计划,免去了服务器配置保护的懊恼。以前一旦呈现故障就须要人工进行紧急解决,应用全托管的 TiDB Serverless 后运维人员能够安心入眠。
● 相熟的 SQL 接口,灵便应答业务增长 :TiDB Serverless 放弃了开发者相熟的 MySQL SQL 语言,AmzTrends 无需进行额定的学习即可高效地投入开发工作,同时 TiDB Serverless 具备一个高度灵便扩大的分布式架构,能够随需弹性扩缩容,应答业务的快速增长。
解决方案
决定迁徙后,AmzTrends 采纳 TiDB Serverless 代替了云上自建的 TiDB 集群,将数据全量迁徙到 TiDB Serverless 中,简化了架构,大大缓解了运维压力,升高总体 IT 老本。
迁徙后,AmzTrends 在 PingCAP 官网服务的帮忙下也进行了架构简化、优化建表、索引优化,进步了整体数据处理效率,并使 AmzTrends 业务架构演进至云原生模式:
○ 索引优化:通过发现和删除冗余数据索引,节俭了 50% 的数据库老本;
○ SQL 查问性能晋升:优化索引后,不仅进步了查问速度,也显著缩小了老本;
○ 架构简化:自建配置核心和服务注册要求的最小三台云服务器转变为单台云服务器,升高了老本和复杂性;
○ 业务缓存建设:在理解业务的根底上建设了业务缓存,进一步升高了理论查问量,节约老本。
我的项目收益
全托管一栈式数据库服务库服务
TiDB Serverless 提供全托管的服务模式,充分发挥了 TiDB 数据库的原有特点和劣势,简化了 Amztrends 的整体架构,晋升了性能和零碎健壮性,同时升高了总体老本。
数据架构老本节俭 50%
通过云原生革新,Amztrends 在数据架构方面节俭了 50% 的老本。(Serverless 采纳全拆散架构,Amztrends 只需为应用付费,无需节约闲置资源)
整体服务资源节约 30%
简化架构后,Amztrends 前端服务资源实现了 30% 的资源节约。
全局老本升高 80%
综合上述优化,Amztrends 实现了整体老本升高 80%。
总结
TiDB Serverless 作为全托管一站式的数据库服务,从根本上解决了 Startup 公司基础架构门槛高的难题,即便短少业余运维人员,也能够领有简化、强壮的数据基础架构,取得了更高的零碎稳定性和可用性。同时,Serverless 的“Pay as you go”模式提供了更灵便、更优化的资源利用率,AmzTrends 从百度云迁徙至 AWS 之后,总体 IT 老本实现了大幅降落。在此基础上,这种灵便的资源应用模式也能够让 AmzTrends 摸索更灵便、更具性价比的商业计划,为商业模式提供更多可能性。
AmzTrends PM Steve 示意:“迁徙到 TiDB Serverless 后咱们不会再去放心数据库的问题,齐全释怀交给 TiDB Serverless 就好了。用最简略的话来讲,没有问题就是最好的后果。”
将来
将来,Amztrend 打算持续利用 TiDB Serverless 的劣势,进一步扩大其业务并摸索更多的数据分析和优化机会。公司还打算通过继续的技术改良和优化,维持并晋升其在市场上的竞争力。