关于tidb:专访中欧财富伍春兰财富管理行业数字化转型升级数据库如何选型

39次阅读

共计 5503 个字符,预计需要花费 14 分钟才能阅读完成。

以下文章来源于 InfoQ 数字化经纬。

InfoQ 数字化经纬:

InfoQ 极客传媒旗下官网账号。面向数字化管理者、从业者、洞察者,提供数字化企业案例、政策解读、钻研报告,做数字时代的「记录者」。

作者 | 赵钰莹

嘉宾 | 伍春兰 中欧财产技术总监

本文采访了中欧财产技术总监伍春兰,探讨了财产治理行业数字化转型面临的挑战,包含人才、平安和技术基础架构。在数据库迁徙中,中欧财产通过采纳分布式数据库 TiDB 解决了 MySQL 的旧有问题,强调了 HTAP 交融架构在性能和资源管理方面的重要性。文章指出,数字化转型须要跨足思维、组织、流程和平台等层面,以适应日益高效和翻新的需要。浏览全文约需 12 分钟。

本文要点:

  • 财产治理畛域近几年受内外部环境的变动,对技术底座能力提出麻利高效、及时翻新等较高要求;
  • 数字化转型不是一个技术问题,波及思维、组织、流程、平台四大层面;
  • 财产治理畛域企业数字化转型次要面临人才,平安、基础架构(技术)三方面的挑战;人工智能技术在财产治理畛域企业外部大规模落地还须要工夫;
  • 在数据库选型之前,企业须要先定位分明需要;
  • 数据库迁徙前,旧有的 MySQL 体系次要遇到的问题是大表 DDL 耗时、分库分表消耗大量人力、单节点写入易呈现瓶颈等问题,最初通过分布式数据库 TiDB 解决了上述问题;
  • 在评估数据库迁徙前后的成果时留神运维、资源等隐形层面的老本;
  • HTAP 交融架构在性能、资源精准耗费等层面都起到了重要作用;

中欧财产数字化转型降级的思路、难点及实际

InfoQ:财务管理公司和基金公司这几年节奏显著变快,其背地的推动力到底是什么?财务管理行业的数字化转型存在哪些痛点?

伍春兰 :最近几年,基金公司内外部环境都产生了比拟大的变动。自 2013 年随同着余额宝的衰亡,整个互联网业务疾速倒退,这对市场带来了几个显著的变动: 第一个变动是 用户根本盘迅速扩充,要想服务好用户,技术迭代速度须要更快。举例来说,一些互联网属性的公司数据刷新较快,中欧财产为了达到这个成果,整个公司做了比拟大的投入和配合,包含引入人工智能技术做一些自动化的事件; 第二个变动是 互联网业务比拟有特点且信息较为通明,用户能够迅速看到市场上呈现了哪些新的业务与渠道,这要求团队时刻放弃麻利和高效,包含与上下游业务的买通; 第三个变动是 业内开始呈现新的营销模式,比方通过直播的形式进行营销,或者经营新的平台,比方抖音等,这须要企业买通外部的经营流程和数据,这对技术团队提出的要求同样是及时翻新、麻利高效。

综上,公司须要抓住机会,迅速做出决策,以应答这些变动。比方,突破原来的数据孤岛,造成对立的、智能的数据中台,基于这个中台能够更好地开掘客户个性、绘制用户画像,从而让产品更好地满足客户需要;与上下游的机构和企业单干时须要具备弱小的研发能力,包含模型、算法、定制化能力等都必须与互联网大厂的研发实力相匹配。

纵观外部和内部,难点次要在于:一是人才方面,并不是每一家金融企业都匹配了弱小的且对技术趋势敏锐的研发团队;二是资源投入能力,比方产品层面的投入是否跟得上;三是数据安全,在适配互联网快节奏的业务更新和及时响应的前提下保障公司外部、与上下游企业单干全链路的数据安全是十分重要的;四是在旧有基础架构上做敏态降级,包含基础设施、运维、研发、产品等。

InfoQ:第二大变动中的“买通上下游”具体指什么?

伍春兰: 数字化转型一是思维、二是组织、三是流程、四是平台。思维上,数字化转型不是某个部门的事件,过程中波及组织及流程上的变动,须要保障大家思维对立;组织和流程上,数据买通就波及跨部门共享,思维对齐的状况下还须要保障组织层面能够尽可能流程化,疾速推动相干决策。比方新业务上线,可能波及经营、产品、研发等多个部门,大家是否能够通明地理解整个执行链路,分明理解公司的决策背景,只有每个部门都参加其中能力真正做到流程提效,而不仅是实现工作。平台上,数据买通之后是否真正用起来,数据品质须要达到什么水平都是平台要重点优化的事件。

InfoQ:针对人才,平安、基础架构三大难题,中欧财产是如何解决的?

伍春兰: 在人才方面,中欧财产于 2014 年左右开始筹备,招聘的大多数员工背景偏互联网和外围金融机构方向,这些员工不仅理解金融的业务状态,同时具备较高的技术能力和敏锐度,整个架构起初就适配了互联网时代的特点;平安层面,除了符合国家相干监管标准的要求,中欧财产自身也做了大量摸索,比方防 DDoS 攻打、流量荡涤、内网监控、数据安全和审计等,这些能力通过过来三四年的倒退逐步建设起来,但要做到齐全自动化还是比拟艰难的。基础架构层面,如前文言,初始架构曾经适配了互联网时代的特点,在过来多年的演进中,中欧财产又针对不同的模块进行了优化,包含分布式数据库体系建设、公有云体系优化等。

InfoQ:您不便举例说明中欧财产通过数字化转型获得了哪些成绩?

伍春兰: 以投顾业务为例,首先该业务须要迅速了解客户需要,并基于数据驱动的逻辑做出疾速、麻利的反馈,这对底层的数据能力要求较高;其次,作为国家首批五家基金投顾业务试点公司,中欧财产次要劣势在于弱小的自主研发能力。过来五年,中欧财产针对整个基础架构进行了降级,底层基建与行业技术演进的大趋势相匹配,实现了软件定义及弹性部署,升高了计算和运维老本。目前,公司业务全面部署在基于 K8s 的公有云上,能够很好地反对投顾等业务的倒退。

InfoQ:如何对待人工智能技术在财产基金畛域数字化转型中施展的作用?

伍春兰:对于人工智能技术的落地,我认为大规模落地还是有难度的。尽管目前很多公司在这方面都有动作,但更多的是尝试,比方智能客服、敏感词审核等。在理论业务中,人工智能更多是在表演辅助的角色,而不是代替很多人的劳动。

具体到金融畛域,因为该畛域强监管且对专业性要求较高,因而目前现有的、通用型的大模型可能无奈很好匹配需要,将来可能会呈现针对该畛域的大模型,只是还须要一些工夫。

面向未来,中欧财产如何联手 PingCAP 打造分布式数据库体系?

迁徙前的旧有数据库体系基于 MySQL 搭建

InfoQ:中欧财产在与 PingCAP 的 TiDB 数据库单干之前,外部的数据体系是什么状态?

伍春兰: 在此之前,中欧财产的数据库体系是基于 MySQL 搭建的。随着业务的逐步倒退,传统的数据体系遇到了一些问题,中欧财产开始思考是否存在一些新的工具、平台、产品能够更好地满足目前的诉求。

在技术层面,团队过后面临着三大比拟显著的问题:一是大表的 DDL 操作,该操作个别通过 gh-ost 工具去实现,十分耗时,且会产生大量 binlog 影响上游的同步。如果遇到有分表逻辑的大表,整个 DDL 过程须要继续几天;二是分库分表,单表数据量增速十分快,时常须要进行分表处理。但开发资源无限,没有这么多人力能够投入到分表工作中;三是单节点写入,MySQL 传统的一主多从架构,主节点承当利用的写入。当有清理或跑批工作时,主节点会呈现写入瓶颈。

分布式数据库选型及迁徙

InfoQ:在分布式数据库选型层面,中欧财产次要看中哪些因素?

伍春兰: 中欧财产在数据库选型层面次要看中整个架构的高可用性、去中心化、性能高且没有单点故障以及能够升高运维老本。以单点性能为例,尽管 MySQL 时代能够通过减少机器的形式来解决问题,但总体无奈实现弹性扩大。通过对一些互联网公司数据库选型的调研,以及对市面上现有数据库产品的理解,最终团队抱着“试一试”的心态开始接触 TiDB。

选型确定后,研发团队对 TiDB 的稳定性、可用性、扩展性等进行了半年左右的测试,整个平台都放到了 TiDB 之上,包含外围业务,综合体验其对场景的适配状况。其实,数据库是一个非常复杂、宏大且外围的工程,且须要与时俱进。TiDB 在过后提出的存算拆散等理念与场景能力特地匹配,且通过多方交换,其架构足以承当将来多年数据量的持续增长。

InfoQ:中欧财产的数据库迁徙次要分了哪几步?

伍春兰: 中欧财产从 2021 年开始进行调研、测试,2022 年开始部署、上线,并于往年进行深度测试并实现 30% 的业务迁徙,包含组合投顾零碎、营销零碎、产品零碎、用户零碎和交易系统,将来心愿能够实现全量业务运行在 TiDB 之上。

回头来看整个过程,中欧财产的办法还是比拟迷信的。一是,企业须要对以后的状况有充沛认知,清晰定位需要并匹配适合的产品;二是团队须要充沛印证降级后的数据库整体架构,对将来演进有明确的计划;三是培养人才,中欧财产和 TiDB 团队做了大半年的亲密交换,并在其社区中学习,对其技术能力、研发能力、现有市场、可预感的协同、定位、技术演进方向等都有了充沛理解;四是筹备备案,即双轮驱动。起初,业务在 TiDB 和旧的 MySQL 体系上同时运行,这种模式下运行了大半年之后,整个技术架构实现了较好适配(当然,TiDB 自身兼容 MySQL 协定),业务运行良好后开始进行正式迁徙,单方团队一起欠缺新老架构的兼容及上游零碎适配。迁徙过程中,上游不会感知到上游的架构变动,团队做了充沛的筹备并严格按计划执行。

生产 TiDB 集群配置如上图,为了应答简单的业务场景,硬件层面都抉择了超配。架构方面,计算层用了 5 台服务器,其中 3 台 TiDB-server 和 PD 混合部署,另外 2 台用于接管简单 SQL 的申请(资源隔离)。每台 TiKV 服务器下挂三块盘,每一块盘都作为一个独立的 TiKV 节点,所有 TiKV 一共有 3*3=9 个节点。集群架构可见下图。

迁徙后的整体评估

InfoQ:您对于数据库体系更换的整体评估是什么?

伍春兰: 一是敏捷性,不须要在资源分配层面投入过多精力,能够更快推广翻新业务;二是简化了公司架构,对立数据库架构之后升高了运维难度和升级换代的难度;三是 HTAP 架构下的一些计算工作的链路缩短,危险绝对更加可控;最初是有利于将来的业务翻新和增长。

具体到技术层面,TiCDC 简化了数据同步 ,TiCDC 能够将 TiDB 内的数据同步至 MySQL 和 Kafka(canal – json 格局),大大降低了数据同步的革新工作; 可观测性 ,配套的 dashboard 和 grafana 十分好用。测试阶段遇到问题或性能瓶颈,能够疾速地定位出问题,加大测试的效率; 服务器硬件故障 ,集群内服务器硬件故障导致宕机,没有影响任何业务;后续配件更换的停机流程也十分丝滑;Tiflash 优化含糊查问,业务有含糊查问的需要,通过 TiFlash 将行存数据转为列存,同时利用 MMP 对查问进行减速。

InfoQ:从运维角度来看,迁徙前后的老本产生了哪些变动?

伍春兰:整体来看,运维层面还是节俭了很多老本。举例来说,原有体系须要拆分出大量集群来经营数十个利用,当初只须要一个 TiDB 集群就能够解决问题,这种经营和计算资源(服务器等)老本是隐形的,因而整个迁徙过程曾经满足降本增效了。当然,很多企业可能足以承当这些老本,但经营效率也是不同的。更换之后,经营效率、架构麻利度失去了极大晋升,这在以后的业务场景下至关重要。

那么,为什么前几年企业不谈这些内容呢?在非互联网、非充沛竞争的状况下,这些问题可能不是最要害的,靠人力驱动也能够搞定。然而,当初的市场环境下,效率在很多时候起决定性作用,这就逼得很多企业不得不对旧有的数据体系做出调整,而且企业不须要在纠结底层的选型和适配问题,资源全副池化,企业能够把所有精力投入到业务自身来获取最终的增长。

InfoQ: 研发同学对于 TiDB 有哪些应用反馈?

伍春兰: 从研发视角,首先咱们对本人有分明的认知才抉择了 TiDB;其次,如上所言,运维难度和老本的升高是能够感触到的;再次,大厂提倡的分库分表技术必定是成熟的,但对小企业来说,这带来的工作量是微小的,在研发资源无限的状况下,这其中的老本不得不思考;而后,业务须要及时、弹性,TiDB 的扩大能力让这一点成为可能;最初,TiDB 的 HTAP 交融架构解决了很多,以往的大批量数据计算工作对资源耗费极大且运行速度很慢,TiDB 在跑这类工作时资源隔离的状况下还能做到智能路由,资源隔离能够保障多个业务可放入一个集群,每个业务配置指定的 RU,保障业务之间不会互相烦扰。遇到突发流量,也能够管制爆炸半径,帮忙精准判断资源耗费,而且性能十分好,这对业务倒退十分重要。

将来打算

InfoQ:将来的迁徙打算是什么?

伍春兰: 整体规划是往年实现 70%-80% 的业务迁徙,目前已根本实现后期筹备工作。如果停顿再快一些,今年底到明年初预计能够实现 90% 的业务迁徙,根本涵盖整个互联网所有的外围业务。心愿在市场新的机会到来之前,整个底层平台能力准备充分。我置信,将来是有广大前景的。

在技术层面,将来会尝试用 TiProxy 替换 Haproxy 或 F5,可能保障集群无损降级,提供限流、熔断等高阶性能,将来能够抓取所有 SQL,实现流量重放,进步测试效率;性能集成,将 Dashboard、TiUniManager、DM-web,甚至 TiCDC 的管控集中在一个平台,该平台还能提供备份治理、告警调整等辅助性能;巡检性能,很多时候要靠人去剖析 Dashboard 和 Grafna 的 Performanceoverview 来判断集群状况。巡检性能能够省去人力开销,依靠 AI 给出精确的集群运行报告,并附上相干优化倡议。

对于中欧财产

中欧财产成立于 2015 年 8 月 14 日,是中欧基金控股的销售子公司,持有中国证监会核准的基金销售业务牌照。旗下 APP 根本实现业内基金种类全笼罩,并为投资者提供基金交易、大数据选基、智慧定投、理财师征询等业余便捷的投资工具及服务,致力为投资者及合作伙伴提供一站式互联网财产治理解决方案。中欧基金是中欧财产的股东,中欧财产与股东之间履行业务隔离。

正文完
 0