目前银行产品存在同质化景象,客户抉择产品和服务的路径越来越多,客户对产品的忠诚度越来越低,所以客户散失曾经成为银行业最关注的问题之一。而取得新客的老本远高于保护老客户老本。
据调研表明,商业银行客户散失较为重大。国内商业银行,客户流失率可达 20% 甚至更高。而取得新客户的老本,可达保护现有客户的 5 倍。因而,从海量客户交易记录中挖掘出对散失有影响的信息,建设高效的客户散失预警体系尤为重要。
上面小编就以某商业银行客户散失预测案例,帮忙大家理解数据分析的过程。以下数据分析过程依靠国内排名靠前的 BI 软件 Smartbi 一站式数据分析平台,能够大大降低数据分析的复杂度,突破数据孤岛的窘境,并且通过简略鼠标利落拽的形式就能够疾速轻松实现数据可视化剖析,让企业都在第一工夫理解到业务数据指标的变动状况。
首先咱们须要对业务现状进行剖析,选取近一年的批发客户某业务的高价值客群进行剖析,如果发现发现流失率十分重大,须要建设高价值客户群体的散失预警模型,寻出客户散失的起因,领导业务增强客户保护,加强客户对本行产品的粘度。
剖析思路能够从高价值客群的个人信息、账户类信息、交易类信息等维度数据动手,以及联合第三方数据,利用随机森林算法构建客户散失预警模型,并输入影响客户散失的次要因素。
数据起源:
数据来源于 CRM 零碎中客户根本信息表、账单表等;第三方数据,数据工夫窗为近一年的数据,客群为高价值客群,本次案例已获取到局部数据总共 100000 条数据。
数据维度信息蕴含:
银行自有字段:账户类信息、个人类信息、贷款类信息、生产、交易类信息、理财、基金类信息、柜台服务、网银类信息;
内部三方数据:外呼客服数据、资产类数据、其余消费类数据;
本次案例散失定义为:3 个月内没有与银行业务任何往来的客户。
整个数据预处理流程图:
相关性剖析
咱们通过相关性节点将各特色指标数据进行 相关性剖析,不便特征选择进入模型训练,如图:
通过剖析发现:是否代发客户、卡等级、月均代发金额、最多代发金额、月均 AUM、月初 AUM 与是否散失都具备相关性,其余特色与是否散失相关性为 0。
因而咱们通过特征选择出具备相干的特色,如图所示,标签列为是否散失。
模型训练
本案例采样随机森林算法进行模型训练,通过拆分节点将数据依照比例 7:3 拆分成训练集和验证集。
整个模型训练流程如图所示:
参数配置如图:
模型评估
咱们通过评估节点对数据进行评估,如模型训练流程图所示,评估后果如图:
咱们发现评估后果中 F1 得分为 0.95,阐明模型预测的成果比拟好的。
业务剖析
咱们通过随机森林特征选择节点输入重要性较高的 5 个特色,后果如图:
通过对某业务线条高价值客群进行散失预警剖析,发现影响客户散失的次要因素为:月均 AUM、月初 AUM、卡等级等。次要起因可能为产品不足竞争力、流动较少等。
因而,咱们能够采取相干的措施倡议,如:增强客户关系维系、产品跟进、保护拜访、追踪制度、扩充销售、机制保护等。