关于数据挖掘:数据分享R语言用RFM决策树模型顾客购书行为的数据预测附代码数据

8次阅读

共计 2307 个字符,预计需要花费 6 分钟才能阅读完成。

全文链接:http://tecdat.cn/?p=30330

最近咱们被客户要求撰写对于 RFM、决策树模型的钻研报告,包含一些图形和统计输入。

团队须要剖析一个来自在线零售商的数据

该数据蕴含了 78 周的购买历史。该数据文件中的每条记录包含四个字段。客户的 ID(从 1 到 2357 不等),交易日期,购买的书籍数量,以及价值。咱们被要求建设一个模型来预测消费者每周的购买频率、书籍的购买单位和购买价值。

RFM 模型

RFM 是一个用于营销剖析的模型,它通过购买模式或习惯来细分公司的消费者群体。特地是,它评估了客户的回顾性(他们多久前进行过一次购买)、频率(他们购买的频率)和价值(他们花多少钱)。

而后,通过测量和剖析生产习惯,RFM 被用来辨认一个公司或组织的最佳客户,以改善低分客户并放弃高分客户。

要害要点

经常性、频率、价值(RFM)是一种营销剖析工具,用于依据客户生产习惯的性质来确定公司的最佳客户。一个 RFM 剖析通过对客户和顾客的三个类别进行打分来评估他们:他们最近有多大的购买行为,他们购买的频率,以及他们购买的规模。RFM 模型为这三个类别中的每一个客户打出 1 - 5 分(从最差到最好)的分数。RFM 剖析帮忙企业正当地预测哪些客户有可能再次购买他们的产品,有多少支出来自于新客户(绝对于老客户),以及如何将偶然购买的买家变成习惯购买的买家。


#### 计算用户最近一次的购买


R_table$R <- as.numeric(NOW - ParsedDate)

### 计算用户的购买频率
aggregate(FUN=length) # Calculate F

### 计算用户的购买金额
aggregate(FUN=sum) # Calculate M

失去每个用户的 RFM 值,利用 RFM 三个值的四分位数来对用户进行分类

多元线性回归模型

查看回归模型后果

失去对 r 值的线性拟合模型的后果,能够看到 RFM 三个分类值都与 r 值有显著的关系,Rsquare 值达到了 0.8 以上,阐明拟合成果较好。

失去对 r 值的线性拟合模型的后果,能够看到 RFM 三个分类值都与 f 值有显著的关系,Rsquare 值达到早 0.4 左右,阐明拟合成果个别。

失去对 r 值的线性拟合模型的后果,能够看到出了 M 分类值以外,FM 的分类值都与 f 值有显著的关系,Rsquare 值达到了 0.4 左右,阐明拟合成果个别。


点击题目查阅往期内容

数据分享 | R 语言用主成分 PCA、逻辑回归、决策树、随机森林剖析心脏病数据并高维可视化

左右滑动查看更多

01

02

03

04

对测试集做预测

线性回归模型预测值和拟合值比拟

预测拟合值的图中,红点示意理论样本点,能够看到 F 和 M 值的预测绝对靠近理论样本点,预测成果较好。然而,误差依然比拟大,因而尝试采纳决策树模型进行预测。

决策树模型预测

ct <- rpart.control(xval=10, minsplit=20, cp=0.1)

绘制决策树

rpart.plot(fitR, branch=1, branch.type=2, type=1, 



           border.col="blue", split.col="red",

 

从后果图来看,决策树对 f 值和 m 值的拟合水平更好。

从三个模型的后果里来看,rel error 和 xerror 都较小,因而模型预测拟合成果较好。

因而,模型的整体成果绝对线性模型失去了晋升。


点击文末 “浏览原文”

获取全文残缺代码数据资料。

本文选自《R 语言用 RFM、决策树模型顾客购书行为的数据预测》。

点击题目查阅往期内容

数据分享 |Python 决策树、随机森林、奢侈贝叶斯、KNN(K- 最近街坊)分类剖析银行拉新流动开掘潜在贷款客户
PYTHON 银行机器学习: 回归、随机森林、KNN 近邻、决策树、高斯奢侈贝叶斯、反对向量机 SVM 剖析营销流动数据 | 数据分享
用 PyTorch 机器学习神经网络分类预测银行客户散失模型
R 语言用 FNN-LSTM 假近邻长短期记忆人工神经网络模型进行工夫序列深度学习预测 4 个案例
Python 中 TensorFlow 的长短期记忆神经网络 (LSTM)、指数挪动平均法预测股票市场和可视化
R 语言 KERAS 用 RNN、双向 RNNS 递归神经网络、LSTM 剖析预测温度工夫序列、IMDB 电影评分情感
Python 用 Keras 神经网络序列模型回归拟合预测、准确度检查和后果可视化
Python 用 LSTM 长短期记忆神经网络对不稳固降雨量工夫序列进行预测剖析
R 语言中的神经网络预测工夫序列:多层感知器(MLP)和极限学习机(ELM)数据分析报告
R 语言深度学习:用 keras 神经网络回归模型预测工夫序列数据
Matlab 用深度学习长短期记忆(LSTM)神经网络对文本数据进行分类
R 语言 KERAS 深度学习 CNN 卷积神经网络分类辨认手写数字图像数据(MNIST)
MATLAB 中用 BP 神经网络预测人体脂肪百分比数据
Python 中用 PyTorch 机器学习神经网络分类预测银行客户散失模型
R 语言实现 CNN(卷积神经网络)模型进行回归数据分析 Python 应用神经网络进行简略文本分类
R 语言用神经网络改良 Nelson-Siegel 模型拟合收益率曲线剖析
R 语言基于递归神经网络 RNN 的温度工夫序列预测
R 语言神经网络模型预测车辆数量工夫序列
R 语言中的 BP 神经网络模型剖析学生问题
matlab 应用长短期记忆(LSTM)神经网络对序列数据进行分类
R 语言实现拟合神经网络预测和后果可视化
用 R 语言实现神经网络预测股票实例
应用 PYTHON 中 KERAS 的 LSTM 递归神经网络进行工夫序列预测
python 用于 NLP 的 seq2seq 模型实例: 用 Keras 实现神经网络机器翻译
用于 NLP 的 Python:应用 Keras 的多标签文本 LSTM 神经网络分类

正文完
 0