关于金融科技:无场景不技术从金融领域价值看实时计算等大数据热点技术

2次阅读

共计 2547 个字符,预计需要花费 7 分钟才能阅读完成。

作者:张良友

宏大、万能和白璧无瑕是数据的力量所在,它是人类生存的开始和主宰者,是所有事物的参与者。没有数字,一切都是凌乱和光明的。

我国的人口和经济规模决定了我国的数据资产规模冠于寰球,具备大数据倒退的先天劣势。随着技术的倒退,大数据逐步交融到各行各业的倒退之中,“数字蝶变”也曾经席卷银行、保险、证券等金融畛域。2020 年 4 月,“数据”首次被地方纳入生产因素,金融业作为数据密集型行业,也正在踊跃推动数据因素施展对其余因素的效率倍增作用。依据 Statista 的统计和预测,2020 年寰球数据产生量约为 47ZB(Zettabyte,十万亿亿字节),这一数字到 2035 年将达到 2142ZB,咱们须要为迎接更大的数据洪流做好筹备

目前,金融大数据在供应链金融、智能营销、智能投顾、智能投研、信用评估、危险定价、反欺诈、风控、舆情监控与股价预测、黑产防备等业务场景中都有比拟宽泛的利用。近年来,大数据技术一直倒退、演进,实时计算、存储计算拆散、与人工智能及云计算等技术的联合受到越来越多的关注。本文笔者将联合这些技术在金融场景中的利用,简要介绍。

大数据 + 人工智能 => 晋升数据价值、服务质量,赋能营销等场景

大数据、人工智能这两种技术的倒退密不可分,两者联合能够面向更多利用场景提供智能数据服务:大数据为人工智能提供了大规模的数据资源,助力人工智能在算法、算力晋升的根底上实现重大突破;传统大数据分析次要针对结构化、半结构化数据,人工智能提供了视频、图像、语音等非结构化数据的剖析能力,拓展了大数据利用场景,例如深度学习提出了一种让计算机主动学习、产生特色的办法,可能更加智能地提取数据不同档次的特色,对数据进行更加精确、无效的表白,目前已在图像分类、语音辨认、问答零碎等畛域获得了比拟胜利的商业利用。

在营销场景,依靠人工智能和多模态数据整合,金融机构能够增强线上线下联动及全渠道信息的整合共享,全面交融并综合利用结构化、非结构化的各类数据,构建用户画像,深入分析用户的持有产品、交易行为、生产偏好等,发现、预测用户的金融需要,为其提供个性化的服务。此外,在晋升服务体验方面,用户的反馈是金融机构进步服务效率和品质的重要根底,通过人工智能和大数据的联合,能够抉择切合相应业务场景的分析模型,对用户意见进行分类、剖析,进而晋升用户满意度及体验。

存储计算拆散的分布式架构、大数据 + 云计算 => 助力金融机构升高治理、运行老本

在传统集群零碎中,计算和存储是严密耦合的,而随着业务的倒退,经常会为了扩存储而带来额定的计算扩容,这其实是一种节约。同理,如果在仅需晋升计算能力的状况下不得不扩存储,也会造成肯定的存储节约。采纳将计算和存储拆散的分布式架构,将存储能力和计算能力离开,各自服务化,能够更好地应答上述有余。同时,随着数据、尤其是非结构化数据规模的快速增长,以及金融机构对大数据系统在可靠性、可用性、性能、经营老本等方面需要的晋升,分布式架构也逐渐成为大数据存储的支流架构。

随着老本管制、资源充分利用等需要的推动,云计算与大数据的倒退路线正在交接、碰撞:云计算为大数据提供了能够弹性扩大的、性价比较高的存储空间和计算资源,大数据对数据的专业化处理过程也离不开云计算的反对。以 DaaS(Data
as a service,数据即服务)为例,其既是 FaaS(Function as a
Service,性能即服务)的一种,也是 SaaS 的天然延长,目标都是尽可能远离 IaaS 以及服务自身的运维,把资源最大限度地解放出来。

因而,大数据存储计算拆散、与云计算的联合,能够大大降低金融机构的治理和运行老本:利用大数据存储计算资源拆散、多租户(共用雷同的零碎或程序组件)、容器化等技术,能够让整体的资源失去充分利用,将资源利用率晋升 20% 以上;在运维方面,大数据技术的供应越丰盛,越有助于升高运维、部署的老本,让运维更加智能化、可视化,实现实时预警、实时响应。

实时计算、实时数仓 => 及时响应业务,赋能金融风控

实时计算 (realtime computation) 是一种工夫复杂性较低的计算,个别是针对海量数据进行的,分为数据的实时入库、数据的实时计算两局部,要求秒级响应。目前,实时计算技术曾经利用到广告、电商、游戏、娱乐等各个领域,比方游戏通过实时剖析玩家数据,能够及时调整参数和平衡性。在金融畛域,也已有金融机构将实时计算利用于实时资产查问和剖析等。

数据仓库 (data warehouse) 是为企业决策制定提供所有类型数据反对的策略汇合, 包含全量数据、历史数据,可分为实时数仓、离线数仓。实时数仓(realtime data warehouse)是指数据的实时性更高、提早性低,个别是统计一天以内的数据,反对毫秒级的统计,可能满足实时化、自动化的决策需要。

危险管制是金融的实质,是银行、保险、证券等金融机构发展金融业务的根底,联合实时计算、实时数仓技术,能够更好地构建能及时、精确反馈危险的风控体系,对金融畛域的实时风控、实时授信、实时反欺诈等多个场景带来新的业务状态和更好的用户体验。在赋能监管方面,实时数仓与人工智能的联合是市场危险、非法集资、异样交易等监测利器。

面向曾经产生的将来

恒生打造了基于开源框架的大数据技术平台,造成了数据治理、数据规范、数据品质等相干的解决方案和产品以及资讯、行情数据经营服务业务,赋能招商证券、华泰证券、中银国际、财通证券、浙商证券、南京证券、博时基金等诸多金融机构。

随着大数据技术的倒退,恒生也在不断完善大数据解决方案,深度联合金融业务个性,建设数据开发平台、实时数仓平台、AI 平台、BI 平台、数据管理平台等外围平台,充分利用云原生、人工智能等技术,为金融机构提供整体的大数据解决方案,在放弃技术当先的同时,也重视产品的牢靠、稳固和高可用。例如,恒生实时数仓平台集实时数据采集、实时流计算、HTAP 等全方位低提早实时能力于一体,通过深度整合数据湖技术计划,能够晋升业务扩大的灵活性;联合流批一体的开发范式,实现从采集到价值化的大数据生命周期全链路的高效率运作。

被誉为“大数据之父”的维克托·迈尔 - 舍恩伯格在其所撰写的《大数据时代》中说道,大数据时代是“曾经产生的将来”,而在这个曾经产生的将来里,没有旁观者。

正文完
 0