乐趣区

关于数据库:声纹识别帮你守住钱袋子聊一聊证券行业里的人工智能

股票、证券等金融交易越来越多地脱离线下而转向线上进行,指纹、人脸等生物辨认技术遍及,而与「钱」相干的场景,如何准确地实现身份辨认和认证?如何保障业务合规?具体而言:

  • 线上交易时,如何保障正在交易的交易者是他自己?
  • 近程操控,如何保障交易人员的资金平安?
  • 具备「非接触式」和「近程辨认」劣势的声纹识别技术,如何在业务场景落地?

上周六,由 Milvus 社区主办的 Arch Meetup 深圳站圆满落下帷幕,泛滥科技爱好者们齐聚一堂,来自 Zilliz、追一科技、掌数科技、极狐(GitLab)和 ShowMeBug 的讲师们与大家分享了开源软件的最新趋势与利用场景。掌数科技技术总监高星 分享了证券基金行业的需要与痛点,以及「问答机器人」「声纹识别」等金融证券行业经营利器。开源向量数据库 Milvus 如何帮忙实现上述场景?让咱们一起先睹为快吧!

轻轻通知你,关注 Zilliz 公众号并回复 「ppt9」 能够取得其余四位讲师们的精彩分享哦!

掌数科技 x Milvus 向量数据库,在金融 AI 畛域会擦出哪些火花?


掌数科技技术总监高新分享现场

掌数科技聚焦证券和大资管行业,面向大数据和 AI 根底技术平台、智能化场景利用和数据安全治理畛域,是一家治理金融行业数据安全的科技企业。掌数科技与厦门大学成立了 ” 金融科技联结实验室 ”,致力于大数据、人工智能技术在金融科技领域的利用钻研。往年,掌数科技还正式成为 WG4 声纹小组《信息安全技术声纹识别数据安全要求》国家标准的五家利用试点单位之一。

在万物皆可 Embedding 的时代,图片、文本、视频、语音等非结构化数据能够通过 Embedding 技术提取为特征向量,而后通过对特征向量的计算和类似度检索来帮忙落地智能问答、商品举荐、声纹识别等场景。开源向量数据库 Milvus 能够赋能 AI 利用和向量类似度搜寻。开源向量数据库 Milvus 反对应用多种 AI 模型向量化非结构化数据,并为向量数据提供搜寻剖析服务。它可解决的业务包含图像处理、机器视觉、自然语言解决、语音辨认、举荐零碎以及新药发现。具体实现形式是:

  • 通过深度学习模型将非结构化数据转化为特征向量,并导入 Milvus 数据库;
  • 对特征向量进行存储并建设索引;
  • 接管到用户的向量搜寻申请后,返回与输出向量类似的后果。

掌数科技基于多年行业教训,通过 「数据库 + 利用」 的形式,在「问答机器人」「声纹识别」等场景中应用 Milvus 向量数据库实现疾速响应,为企业在数字化建设过程中提供高质量、易扩大、低成本、易保护的解决方案。

金融证券行业的需要和趋势

金融是一个财产集中的畛域,在掌数科技主攻的证券市场,其规模在 2020 年的总资产达到 8.9 万亿,具备散户比例高、受多方因素影响稳定大、金融产品品类不多等特点,因而,证券行业的客户经营畛域天然产生了如下两点需要:

(1)如何在用户规模迅速增长的过程中,高效、牢靠、合规地服务投资者客户?

  • 金融证券行业须要进步线上自助化服务水平,把可能由零碎和用户自主操作来实现的局部尽量交给零碎,防止过多依赖人工;同时,把不能齐全交给机器执行的业务或操作,尽量采纳人机协同的形式,升高人工的工作;
  • 金融证券行业须要建设客户数据中心,为客户经营、客户服务提供对立的数据服务平台;
  • 金融证券行业须要借助大数据和人工智能伎俩,加强对客户身份的核实,对客户精确用意的把握,对客户危险承受能力的辨认,躲避经营风险和操作危险。

(2)如何在客户投资理财过程中晋升体验,帮忙客户简略地、愉悦地实现投资预期?

  • 金融证券行业须要把「投资者教育」融于产品的细节当中,在场景中晋升投资决策程度;设计更为丰盛的组合产品,为投资者提供更多投资选择,平抑投资危险;以客户为核心,建设跨渠道的客户服务,实现不同渠道的无缝对接。

除了上述两大需要,金融证券行业正在拥抱以下四个趋势:

  • 线上化的趋势:金融科技倒退和经营集中化、自动化、智能化;
  • 散户机构化趋势:公募基金、资管用户规模倒退迅速;
  • 合规监管难趋势:目前用户服务能力与需要不匹配、用户危险等级辨认与匹配;
  • 证券机构科技部门自研能力有余:外购产品居多,个性化自研较少。

为了应答上述的需要和趋势,智能经营的产品体系须要在多种场景下应答自若,次要包含客户多渠道服务场景、客户私域经营场景、外部大经营场景三大场景。在这些场景的外围架构中,会应用到大量的结构化和非结构化数据,以及相应的技术组件,比方 Docker、Kubernetes、CI/CD 流水线等利用技术架构组件。其中,用于剖析非结构化数据的要害组件就包含了 Milvus 向量数据库。三大场景的整体架构如下图所示:

场景一:智能客服机器人

掌数科技通过引入开源向量数据库 Milvus,构建了一套欠缺的智能问答零碎,帮忙在线客服实现答疑和举荐。

智能的问答组件能够实现 80% 常见问题的主动回复,大大加重人工客服的工作量。此外,该问答零碎不仅能实现简略的问答,还能够做出综合的观点举荐。基于用户已经收回的大量申请,零碎会召回最适宜该用户的答案并举荐给用户,实现「基金产品卡片常识」举荐、「基金经理卡片常识」举荐、「用户输出主动补全」等性能。

同时,基于开源向量数据库 Milvus 构建知识库搜索引擎,还能够搭建面向外部人工客服的智能知识库,辅助相干人员疾速响应客户发问。

须要留神的是,在金融证券业务中,根底数据库与其余行业不同,须要预处理一些行业常识。比方,产品的命名通常有本人的规定,在其余的语料库中不常出现「天天盈」「丰泽」等基金名,所以须要基于现有的语料库进行训练,实现数据预处理。在实现流程中,开源向量数据库 Milvus 的高性能检索能够实现毫秒级响应,召回数千条数据集,极大升高了开发成本、缩短我的项目周期,后续零碎进一步精排算法,筛选出 10 条数据作为响应后果。智能客服机器人背地的实现流程如下图所示:

场景二:声纹场景

依据行业客户适当性治理方法要求,以及反欺诈、反洗钱等合规风控要求,客户身份的认定与审核 是金融证券行业必须要重点关注的技术畛域。过来,多采纳账号密码来认定客户身份,然而明码容易透露。故个别进步安全等级,会要求输出手机动静明码或者 U 盘等额定设施躲避密码保护的破绽,后又扩大为基于 Face ID 的人脸识别技术。然而,在局部不适宜应用人脸比对的场景中,须要借助语音辨认与声纹比对技术作为补充。与其余生物特色相比,获取声纹特色的语音非常不便、天然,用户接受度高,而且老本较低,通话中无需额定的录音设施,声纹识别和确认的算法复杂度低,其动静特色更在利用平安上独占劣势。

在金融行业中,声纹利用的技术要求是:

首先,精度要高。对合乎辨认要求的音频数据集比对辨认算法的精度,尤其是 1:1 的身份确认场景,其精度要求最高达到 99.5% 以上;联合人脸或者其余技术后,零碎被攻破的难度将成指数级回升。

其次,性能要好。千万级的声纹库的客户身份确认过程,须要可能实现秒级响应,否则用户体验会十分蹩脚;声纹数据库要实现无缝横向扩大,以便应答更大规模的声纹平台体量;在对 VIP 客户或者黑名单客户的识别场景,要可能在数秒到 1 分钟内疾速查找到类似后果。

最初,老本要低。采集端应用一般电话或者电脑麦克风,服务器端采纳一般 X86 服务器即可;无需专用服务器硬件,在推断辨认场景,不须要 GPU 或其余非凡硬件卡的减速,即可实现声纹库与声纹平台的搭建。声纹场景的实现流程如下图所示:

通过引入开源向量数据库 Milvus,掌数科技构建并积攒客户声纹库,帮忙在客户在线上开户、业务开明场景中,提供面向客户身份数据的向量存储、检索比对、黑名单客户辨认服务。声纹检索的实现流程如下图所示,首先输出指标语音,进行特征提取和模型训练,将特征向量保留在 Milvus 向量数据库中,当须要进行特色比对时,可进行疾速提取和比对。1:1 的声纹比对指的是确认「你是不是你 」,用于人员活体认证、人员身份认证和挪动客户端身份认证;1:N 的声纹识别用于答复「 你是谁」的问题,用于在向量库里查找该指标的身份和查重。Milvus 数据库的利用,很好地帮忙业务达到了金融畛域技术指标,做到了高精度性能的优化。

在客户服务场景中,办理客户回访或其余业务受理时,须要查看证券业务服务流程是否合规,校验沟通话术。综合上述多个技术,能够进一步造成智能语音质检解决方案,实现流程如下图:

总结

掌数科技基于开源向量数据库 Milvus 搭建了智能客服机器人的问答和举荐零碎,以及声纹场景中的确认和识别零碎,达到了金融行业 精度高、性能好、成本低 的相干技术要求,咱们心愿将来 Milvus 向量数据库反对更加丰盛的性能,适应更广大的利用场景,在金融行业失去更广泛应用。

退出移动版