乐趣区

关于数据库:案例基于星环科技数据云平台TDC为富国基金建设万能的数据湖

星环科技作为企业级大数据根底软件开发商,通过施展根底软件硬实力曾经胜利助力金融、政府、能源、交通、制造业等多个行业的客户实现了数字化转型,积攒了丰盛的成功经验。【行业案例】旨在定期分享星环科技最新案例成绩,为各行各业企业数字化转型提供参考和决策依据。

本篇将介绍星环科技如何基于数据云平台 TDC 为富国基金建设万能的数据湖,助力其实现数据对立与共享替换。

案例背景

富国基金治理有限公司成立于 1999 年,是中国老 10 家基金公司之一。2003 年,加拿大历史最悠久的银行——加拿大蒙特利尔银行(BMO)参股富国基金,富国基金治理有限公司又成为国内首批成立的十家基金公司中第一家外资参股的基金治理公司。截止到目前为止,富国基金全产品的资产规模超过了 12,000 亿,这个规模还在一直增长。基金公司从某种意义上也是数据公司。采集数据、加工数据、利用数据,最终做出业务决策是基金公司在运作中典型的工作过程。在这个过程中,数据从信息转化为价值的能力决定了公司的竞争力,它取决于数据采集、解决、利用效率、准确性、以及信息的服务形式。当行业的超额收益放大了当前,信息劣势就决定了基金产品收益的稳健性、危险控制能力与客户服务品质。随着行业的倒退,投资种类的多元化,资产规模的回升,基金产品成为机构与集体投资的重要工具,来自内部监管等方面无关数据品质、数据安全、综合数据治理程度的要求也日渐晋升;同时,富国基金作为行业的头部公司、系统性金融单位,更须要特地在数据治理、数据安全、数据品质等方面建设较好的保障与管控机制。然而,富国基金原来繁多的数据仓库平台架构开始面临诸多挑战:

不反对实时数据处理:实时风控大屏、实时直销申赎统计、画像及精准营销、实时估值等业务需要日益迫切,联合富国基金 IT 整体规划要求,富国基金应适时构建实时数据处理能力。
数据仓库平台存储低廉:解决海量数据的存储问题,依据数据价值高下、数据的冷热不同,存储到不同的平台介质上。
不反对半构造、非结构化数据处理:基金公司各类研报、布告、舆情等内部资讯数据对公司的决策同样至关重要,而该类数据很多是半构造、非结构化的存储格局。
数据孤岛问题:不同团队各自建设,数据没有买通;同一份数据在多个业务零碎内保留;短少统一标准,难以进行数据管控和品质晋升。
不反对云原生部署:现有数据仓库平台 Vertica 构建在分布式数据库上,基于物理服务器部署,弹性有余。
解决方案

针对富国基金面临的挑战和现状,基于星环科技数据云平台 Transwarp Data Cloud 为富国基金提供了一站式数据湖解决方案。

基于星环科技数据云平台 Transwarp Data Cloud(以下简称 TDC)、星环大数据开发工具 Transwarp Data Studio(以下简称 TDS)、星环智能剖析工具 Sophon 等产品的数据湖解决方案,可能一站式解决企业从建湖到管湖全副过程,为富国基金治理和决策提供数据根底与剖析能力保障,晋升富国基金的竞争力。

作为富国基金数据湖云底座的数据云平台 TDC,基于云原生技术构建,具备极致的弹性能力,并且交融了数据 PaaS、剖析 PaaS、利用 PaaS,实现数据、利用、模型的互联互通,突破富国基金不同业务零碎的数据孤岛。

在数据治理、元数据、数据品质、数据资源目录等能力上,星环科技提供了集开发与治理为一体的一站式工具平台 TDS,提供了数据开发、数据集成、数据管控、数据商城和数据服务等能力。TDS 的子产品涵盖了:数据库开发工具 Waterdrop、数据库在线开发与协同工具 SQLBook、大数据整合工具 Transporter、任务调度软件 Workflow、可视化报表剖析软件 Pilot、数据服务开发与管理工具 Midgard 以及数据资产目录软件 Catalog、数据治理工具 Governor、数据安全防护工具 Transwarp Defensor、数据商城 Transwarp Foresight、数据服务开发与管理工具 Midgard 和标签治理平台 StarViewer。能够帮忙富国基金造成规范的数据资产治理标准、构建对立的数据加工、共享能力,造成数据资产。

Sophon 是一款蕴含数据分析与机器学习建模的一系列智能剖析工具软件,可能一体化地实现从数据集成、模型构建、常识推理、辅助决策,撑持业务的数据分析、摸索、服务流程,从而能够帮忙开发者将智能化落地到企业应用中,帮忙企业进行以数据驱动为外围的开发、经营和产业降级。Sophon 次要笼罩数据分析中的计算智能、感知智能、认知智能等三个次要方向。Sophon 的技术特点是采纳分布式计算模式,能够进行结构化、半结构化和非结构化三种不同类型的数据的接入、解决、剖析与模型公布及管理工作。在富国基金项目上,能够用于搭建联结翻新实验室,通过引入人工智能、数据挖掘技术来晋升数据价值能力。

建设功效

通过 TDC 的多租户能力

实现富国基金数据的对立与共享替换

TDC 通过建设富国基金对立的数据湖租户空间,对立归集富国基金外部各业务零碎的数据,实现了富国基金数据的高效治理和管控。

TDC 数据湖可轻松实现数据在不同利用(租户)之间的共享,后续新增租户可间接应用对立数据湖共享的数据,租户共享集群中的某些节点,这些节点能被所有基于 TDC 创立的租户调度。

TDC 上可按需创立租户,租户间资源隔离、数据隔离、业务隔离,不同租户按需部署不同的利用。同时,TDC 反对将不同租户设置互信,相互之间共享组件和数据。租户之间计算资源可动静共享,租户 2 闲暇时,租户 1 可应用客户的全副服务器的计算资源,提供计算性能和查问效率。租户可将本身组件共享进来,在 TDC 数据云内与其它共享。租户组件的共享可缩小组件部署老本。通过租户共享,辅助权限管控,实现租户之间数据的共享。基于 TDC 帮忙富国基金构建的企业级数据 PaaS 平台能够实现以下性能:

★ 对立富国基金的数据 PaaS,大数据业务全副基于 TDC 赋能

★ 数据 PaaS 平台反对开源组件、中间件的扩大

★ 实现多租户场景下多云交融

★ 进步了资源利用率,按需创立租户,租户资源相互给

★ 业务隔离,不同租户按需部署大数据产品实例

★ 利用和数据对立部署

★ 利用和数据逐渐互通、交融

★ 基于公有云平台建设数据湖、Hyberbase 容灾场景

★ 对立的数据湖空间,高效治理企业数据

★ 通过共享组件辅以权限管制,实现数据的按需共享和替换

★ 通过多租户数据湖进行对立的数据申请下发

最终成绩

已实现构建集数据吞、吐、存、算于一体 的 TDC 数据湖第一阶段建设,实现包含离线批处理、数据分析、实时流解决等根底能力。
建设基于 TDC 的数据湖,实现多源数据归集,具备丰盛的数据获取能力,实现数据在不同租户间的治理和共享,解决历史数据存储及数据孤岛问题。

正在摸索的能力

一直优化欠缺基于 TDC 帮忙富国基金构建的企业级数据 PaaS 平台,充分发挥大数据平台性能与场景劣势,同时辅以数据资产治理及数据检核,助力富国基金数据品质整体晋升,实现数据资产化并赋能业务利用。
搭建全生命周期的数据资产治理平台最终实现数据对立存储、对立资产治理、对立数据服务、对立平安治理及运维,在晋升数据资产治理能力的同时,满足各利用零碎多样化需要。
量化投研,基于星环时序数据库的产品能力以及多年来对于分布式计算的深刻理解,帮忙富国基金晋升智能量化投研能力。

将来布局

在欠缺数据管理能力的根底上,帮忙富国基金构建数据迷信平台,实现反洗钱、舆情监控、智能选基等人工智能场景。

退出移动版