共计 3355 个字符,预计需要花费 9 分钟才能阅读完成。
文|梁仕威(花名:栖川)
蚂蚁团体算法专家
方略平台技术负责人,专一于分布式计算畛域,次要负责蚂蚁根底算法的分布式设计与开发。
本文 3419 字 浏览 9 分钟
在相似平安风控这种对抗性的场景中,因为欺诈者作案手法的频繁变动,使得训练数据并不总会蕴含足够的信息给算法主动挖掘出优质的拦挡规定,这种场景下高质量拦挡规定的开掘须要联合专家畛域常识。如何将算法和专家畛域常识相结合成为了业界一个值得摸索的课题。蚂蚁团体 AI Infra 团队针对上述问题,构建了一个交互式的规定研发零碎——方略,提供了一种在规定研发过程中高效融入专家畛域常识的解决方案。
形容该零碎的 Demonstration Paper《Fanglue: An Interactive System for Decision Rule Crafting》近期曾经被数据库畛域的重要会议 International Conference on Very Large Data Bases (VLDB2023) 所接管。VLDB 是中国计算机学会 (CCF) 举荐的 A 类会议,每年都会吸引国内外各大高校和科技公司的投稿。
1►背景
决策规定因为其直观可解释的 If-Then 构造,被广泛应用于欺诈预防等金融科技领域至关重要的工作中。规范的决策规定由两局部形成:一系列条件和预测值。 条件是由 特色、操作符、值 形成的三元组构造,例如 age<50。当规定中的所有条件都被满足时,规定会输入预测值。
目前大多数现有的规定开掘零碎都是以端到端模式运行的,即给定训练集后,专家设定规定开掘算法的优化指标和超参数,而后期待算法运行完结就能够取得一组规定。在这种形式下,设置超参数和优化指标是融入专家畛域常识的惟一路径,一旦规定开掘过程开始,专家就没有其余办法可能干涉规定的生成。然而在如风控这种对抗性的场景中,因为作案手法的频繁变动,训练数据里并不总会蕴含足够的信息给算法主动挖掘出优质的规定。在这种状况下,专家必须将畛域常识更深刻地交融到规定生成过程中能力取得有意义的后果。
举个例子,假如支付宝的一位风控专家,想要编辑规定来拦挡一种新型欺诈行为。因为该欺诈行为是最近才呈现的,他筹备的数据集中只有多数对于这种欺诈行为的黑样本。假如这种欺诈行为的一个关键步骤是要求受害者向欺诈者发送多个付款码,因而短时间内付款码刷新的次数是辨认这种欺诈流动的重要特色。然而风控专家发现开掘算法返回的规定中没有应用该特色,大多数规定都应用了交易金额来辨别欺诈行为和失常行为,因为数据集中的交易金额偶合地将这两种行为辨别开了。然而随着新型欺诈行为的遍及,交易金额就不能持续作为辨认这种欺诈行为的无力根据了。这种景象在反欺诈场景中并不常见,当黑样本太少时,无关的特色也可能辨别出输出数据中的黑白样本。尽管付款码刷新频次的确是规定开掘过程中一个十分有竞争力的特色 (例如评估指标排名靠前),但因为数据中噪声的影响,使得其不能排到最后面,从而不能被算法开掘进去。这种状况下,将专家畛域常识融入进来,让付款码刷新频次这个特色利用到拦挡规定中,对阻止新型欺诈行为扩散尤为重要。
为了能在规定研发过程中高效融入专家畛域常识,蚂蚁团体 AI Infra 团队构建了一个交互式的规定研发零碎——方略。方略为用户提供了一个 Web 界面来可视化地制订决策规定。用户将数据上传到方略后就能够开始规定研发流程,方略会实时地举荐出规定的候选条件与对应评估指标,并生成数据分析后果,为用户提供有用的定量分析信息。同时方略应用 Ray 作为计算引擎并将数据分布式存储在内存中,以满足在交互式解决大规模数据时的实时响应需要。
2►零碎架构
图 1
图 1 展现了方略的零碎架构。用户通过 Web 界面与方略进行交互。方略的界面上有三个外围模块:条件举荐模块 、 条件编辑模块 和规定评估模块。服务端的 Task Manager 负责接管来自三个外围模块的申请①,并且会启动相应的 Ray 作业②。
用于计算的数据程度切分后事后加载进 Ray 的一组 Actor 内存里。对于一个特定的计算工作,每个 Actor 都会基于调配到的数据计算出部分统计信息,这些部分统计信息会会集到 Driver 里进一步解决失去全局统计信息③。而后全局统计信息返回给 Task Manager④,并被传递给 Data Processor。Data Processor 在全局统计信息的根底上进一步解决,例如计算出各个候选条件的评估指标,失去的处理结果会在 Web 界面上展现给用户⑤。而后整个零碎会期待用户的下一步操作。
一旦用户作出某些操作 (例如从候选条件中抉择一个退出到以后规定中) 触发相应的外围模块,零碎就会反复上述过程。用户编辑好的规定会保留到数据库里⑥。
3►技术细节
不同于规范规定,方略采纳合取范式 (Conjunctive Normal Form) 的规定示意模式,即同时反对“AND”和“OR”条件。合取范式规定是由一个或多个子句和一个预测值组成的合取式 (AND 连贯),其中子句是条件的析取式 (OR 连贯),条件的模式为特色、运算符、值。方略专一于二分类问题,应用训练集和验证集上的精确度、召回率、F1 得分或黑样本覆盖率等指标来评估决策规定。
方略提供三种实时的条件举荐帮忙用户构建规定:“AND”条件举荐 、“OR”条件举荐、 近似条件举荐。
假如咱们曾经有了一些子句形成的决策规定,须要往这个规定中减少一个“AND”或者“OR”条件,方略会搜寻所有可能的三元组 (特色、运算符、值),并通过将这些候选条件附加到以后规定里计算评估指标。规范的规则学习算法会抉择具备最佳指标的候选条件,而方略会在 Web 界面上展现在验证集上获得 top 评估指标的候选条件列表供用户抉择。
为了疾速计算所有候选条件的评估指标,方略应用 Ray 作为计算引擎,每个 Actor 计算出部分统计信息,而后聚合到 Driver 里失去全局统计信息。为了验证零碎的效率,咱们在一个蕴含 140 万个样本和 50 个特色的数据集上进行了试验。图 2 比照了在生成“AND”候选条件下,方略的实现与基于 Mars on Ray (基于 DataFrame 运算) 实现的耗时。能够看到方略的实现十分高效,应用 16 个 Actor 就能够在 1 秒内返回后果,满足交互式环境下高响应的须要。
图 2
在平安风控场景下,当规定中存在一些容易被攻打的条件时 (例如拦挡规定里有条件:转账金额 >=500,欺诈方只须要使得转账金额小于 500 就能够绕过拦挡规定),风控专家会心愿通过寻找“语义上类似”的条件来减少另一层爱护。为了增强规定的鲁棒性,方略提出并引入了近似条件。假如以后的规定是 C1 and C2 and C3,笼罩的样本集为 A,咱们心愿在 C2 上减少近似条件,那么方略会在 C1 and C3 的根底上遍历所有的候选条件 (特色、运算符、值),每个候选条件都会笼罩数据的一个子集,记为 B。一个现实的近似条件应该在 A 和 B 之间具备高重叠度,同时又不引入太多额定的白样本。方略基于图 3 所示的公式掂量条件的类似度,其中示意中带有正标签的子集,示意中带有负标签的子集。
图 3
方略反对在一个数据集上顺次编辑多条规定。当实现一条规定,用户能够抉择将这条规定笼罩的数据删除,以便在编辑下一条规定的时候能专一于没有被笼罩的数据,这种模式叫做 序贯笼罩模式,如图 4 所示。
图 4
4►场景演示
图 5
图 5 左图在面板的右侧展现了方略举荐进去的“AND”条件,其中有多个特色的候选条件具备雷同的 Recall,用户将会依据畛域常识来抉择其中一个条件退出到画面两头的规定里。左边的图为用户在方略上手动编辑“AND”条件的弹窗。
图 6
图 6 左图展现了一个选定的条件在减少近似条件 (浅绿色) 之前和之后的截图,能够看到在以后规定上减少了近似条件后对规定的指标不会造成太大的变动。右图为方略举荐进去的近似条件及其 Overall SIM 和 POS Jaccard 指标。
具体可参考方略零碎的演示视频:方略零碎演示视频
5►总结 & 将来打算
以后方略曾经利用到蚂蚁团体外部的平安风控场景中,也输入给了内部的金融机构。这种算法与专家畛域常识相结合的交互式规定研发形式,不仅进步了规定的研发效率,升高了研发老本,也通过摸索更广的规定空间进步了规定的准确度。
下一步咱们会针对举荐算法和评估指标做优化与扩大,以满足更多复杂多变场景的需要。
欢送大家多关注蚂蚁团体 AI Infra 团队后续的工作。