关于算法:决策树算法建立电信客户流失模型

95次阅读

共计 1146 个字符,预计需要花费 3 分钟才能阅读完成。

原文链接:http://tecdat.cn/?p=1603

Consumers will subscribe to multiple telecom services (televisions, paid programs, games, etc.) today. However, the degree of differentiation provided by telecom providers is not high, and customer loyalty becomes a problem.

As a result, it is becoming increasingly important for telecom companies to proactively identify lax-minded customers and take precautions to keep these customers.

Based on the above background, tecdat researchers analyzed the loss of data for 16 years to date and established a prediction model to identify customer groups with high probability of loss and to identify which user characteristics (“X”) were lost to users (” Y “) will have a significant impact.

▍数据概览

应用收视服务的用户最多,订阅付费节目其次,订阅游戏业务用户数量起码。

订阅收视业务的用户增长最快,其次是订阅游戏业务的用户,而订阅付费节目的用户增长迟缓,同时散失重大。

相比拟 16 年,用户净增长 37%,然而 17 年上半年的散失比例相比拟去年减少 8%。

▍不同维度的流失率比拟

咱们比拟了不同营业厅和是否发放数字机顶盒的用户散失状况。

能够看到相比拟发放了数字机顶盒的用户来说,没有发放机顶盒的用户更容易散失。

从不同营业厅的散失状况来看,沙河站和南口站的流失率最高,昌平站和小汤山站的流失率较低。

▍用户散失预测模型

而后,咱们应用 DT 算法剖析电信客户特色的特点,并取得散失客户的基本特征,剖析客户的行为特色,采取有针对性的措施,改善客户关系,防止 客户损失或留住客户,达到补救的成果。

▍技术

DT(decision tree) 用于构建、验证和测试数据集的模型。

在 Spark / MLLib / Scikit-Learn / HDFS 中重构实现解决较大的数据集。

▍后果

模型预测客户散失的精度精度达到 93.2%。

影响客户散失或对“Y”产生重大影响的要害变量有:

营业厅的地位

是否发放数字机顶盒

在剖析客户的行为特色之后,咱们采取有针对性的措施,改善客户关系,防止 客户损失或留住客户,达到补救的成果。

正文完
 0