关于tidb:AmzTrends-x-TiDB-Serverless通过云原生改造实现全局成本降低-80
本文介绍了厦门笛卡尔数据(AmzTrends)在面临数据存储挑战时,抉择将其数据分析服务迁徙到 TiDB Serverless 的思路和实际。通过全托管的数据库服务,AmzTrends 实现了全局老本升高 80% 的成果,同时也充沛展现了 TiDB Serverless 在简化架构、晋升性能和降低成本方面的劣势。将来,AmzTrends 打算持续利用 TiDB Serverless 的劣势,扩大业务并晋升竞争力。 厦门笛卡尔数据是一家专一于跨境电商数据分析的 SaaS 公司,AmzTrends 为亚马逊卖家提供品牌剖析(ABA)、商机探测以及广告数据的可视化剖析。目前,AmzTrends 次要以 SAAS 和 Chrome、紫鸟浏览器的插件模式为客户提供数据服务,以订阅模式为美国、日本、中国数万计的跨境电商卖家进步数据服务,帮忙卖家在选品、经营、广告等经营环节提供业余的数据分析决策价值 。 业务挑战AmzTrends 的数据次要以大单表的模式进行存储,最大的表数据量超过 22 亿,字段较多且某些字段很长的大宽表,单表中存在结构化与非结构化的数据结构,因而须要建设大量的索引,占用大量存储空间,而且过期数据还须要定期清理,常常应用 BATCH 进行批量操作,一旦遇到异样无奈无奈事务的一致性,因而数据保护压力微小。 技术痛点在业务初期,AmzTrends 抉择了在百度云上自建 TiDB 集群,资源按月付费。集群规模蕴含 1 个 TiDB 节点、1 个 PD 节点(此种部署形式会侵害 PD 的高可用性,为了节约老本的部署形式,是官网不举荐的高风险计划)、3 个 TiKV 节点,技术人员通过将亚马逊下载的原始 CSV 格局的数据批量写入到 TiDB 中进行数据分析。此外还独自配置了 3 台服务器部署 Spark,进行全量简单的数据计算剖析。但 Spark SQL 与关系型数据库不同,须要专人运维,简单的业务架构造成了资源冗余,使得运维老本较高。 因为集群配置不够加上业余运维团队的缺失,弃用了 Spark,大量简单且数据计算量微小的工作由 Spark 转到 TiDB 间接运行,集群越来越不稳固,数据安全面临重大挑战。在这种状况下,AmzTrends 不得不寻找对技术要求更低且更平安的运维解决方案。在接触到 TiDB Serverless 后,AmzTrends 认为因为都是 TiDB 产品体系,全托管的一栈式数据库服务 TiDB Serverless 不仅能够充分发挥 TiDB 数据库原有的个性和劣势,还能够帮忙公司简化架构,晋升零碎的整体性能和健壮性。所以,AmzTrends 决定将整体利用从百度云部署计划迁入 TIDB Serverless,不仅危险更低且兼容性和性能都能失去无效保障,另外通过数据容量与申请量的老本预估,AmzTrends 发现迁徙后老本能比现有的云服务器部署更低,因而有了这样一次充斥挑战的数据迁徙过程。 ...