关于数据挖掘:Python用机器学习算法进行因果推断与增量增益模型Uplift-Modeling智能营销模型附代码数据

7次阅读

共计 5430 个字符,预计需要花费 14 分钟才能阅读完成。

原文链接:http://tecdat.cn/?p=27058

最近咱们被客户要求撰写对于因果推断与增量的钻研报告,包含一些图形和统计输入。

应用 ML 进行晋升建模和因果推理

Python 包提供了一套应用基于最近钻研的机器学习算法的晋升建模和因果推理方法。容许用户依据试验或察看数据预计条件均匀解决成果 (CATE) 或个体解决成果 (ITE)。实质上,它预计了干涉 对 具备察看特色的用户的 T 后果 的因果影响,而对模型模式没有强烈的假如。典型用例包含

  • 广告流动定位优化:
  • 在广告流动中进步投资回报率的一个重要伎俩是将广告定位到在给定 KPI(如参与度或销售量)中会有良好反馈的客户群。通过依据 A/B 试验或历史察看数据在集体层面预计广告曝光的 KPI 影响来辨认这些客户。
  • 个性化参加:
  • 公司有多种抉择与客户互动,例如在追加销售或音讯渠道中的不同产品抉择。能够预计每个客户和解决选项组合的异质解决成果,以获得最佳的个性化举荐零碎。

目前反对以下办法

  • 基于树的算法
  • 欧几里得间隔和卡方上的随机森林
  • 晋升树 / 随机森林
  • 元学习算法
  • S 学习
  • T 学习
  • X 学习
  • R 学习
  • 工具变量算法
  • 2 阶段最小二乘法 (2SLS)

    开始

    S、T、X 和 R 学习的均匀解决成果预计

    xg = XGBTRrssor()nn = MLPTReesor(hidenlayer_izes=(10, 10))xl = BaeXegrsor(lernr=XGBeresor())rl = BaeRReresor(lerner=XRegrssor())

    可解释的因果机器学习

    提供了解释如下训练的解决成果模型的办法:

    元学习特色的重要性

    # 加载合成数据 np.array(['treaet_A' if x==1 else 'cotol' for x in trtent]) # 解决 / 管制名称 RnFostRgesor()  # 为 model_tau_feature 指定模# 在根底学习器中应用 feature_importances_办法 plot_ipornce()# 绘制 shap 值 pot_shp_ues()# interaction_idx 设置为 'auto'ploshp_dpedece()

    • *

    点击题目查阅往期内容

    R 语言应用马尔可夫链对营销中的渠道归因建模

    左右滑动查看更多

    01

    02

    03

    04

    晋升树可视化

    uplit_del.fit(df[fars].values,

                 trtnt=df[‘trtme_rop_ey’].values,

                 y=df[‘cvesin’].values)


![图片](https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/d7df7c648844487895bc15de3ccb62c3~tplv-k3u1fbpfcp-zoom-1.image)

* * *

  


* * *

  


![图片](https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/734afe5eec6c4198906215e46566a9a0~tplv-k3u1fbpfcp-zoom-1.image)

点击文末 **“浏览原文”**

获取全文残缺材料。本文选自《Python 用机器学习算法进行因果推断与增量、增益模型 Uplift Modeling 智能营销模型》。** 点击题目查阅往期内容 **

[Boosting 原理与 R 语言晋升回归树 BRT 预测短鳍鳗散布](http://mp.weixin.qq.com/s?__biz=MzU4NTA1MDk4MA==&mid=2247513943&idx=2&sn=bb7b7fce21f368c6fd07fabbb09028a9&chksm=fd92895ccae5004a8e32f85b02210ec00d210be6fb93c148fe390202cb9a1856e0a88a809cf7&scene=21#wechat_redirect)[Python 决策树、随机森林、奢侈贝叶斯、KNN(K- 最近街坊)分类剖析银行拉新流动开掘潜在贷款客户](http://mp.weixin.qq.com/s?__biz=MzU4NTA1MDk4MA==&mid=2247500812&idx=1&sn=b86cc97f4d72c4a405307538c197ef1e&chksm=fd92fa07cae5731190412d4118623b03efeccb6f64687334773c0161ae643a945f5f7d94c541&scene=21#wechat_redirect)  
[R 语言逻辑回归(Logistic Regression)、回归决策树、随机森林信用卡守约剖析信贷数据集](http://mp.weixin.qq.com/s?__biz=MzU4NTA1MDk4MA==&mid=2247500408&idx=1&sn=90a05918163d0b313663b1c6e12a8bf5&chksm=fd92fc73cae5756556b06c2930784e58c3b338a9efffa5746062a882585af5ae3b0c000cd3cd&scene=21#wechat_redirect)[R 语言基于 Bagging 分类的逻辑回归(Logistic Regression)、决策树、森林剖析心脏病患者](http://mp.weixin.qq.com/s?__biz=MzU4NTA1MDk4MA==&mid=2247496872&idx=1&sn=75ff23eea0d78cd9345675a815623dbf&chksm=fd92caa3cae543b5c8bc97353084e24634346343f75a2b0009a48f38020c084aeb4d72ec506a&scene=21#wechat_redirect)  
[R 语言样条曲线、决策树、Adaboost、梯度晋升 (GBM) 算法进行回归、分类和动静可视化](http://mp.weixin.qq.com/s?__biz=MzU4NTA1MDk4MA==&mid=2247496608&idx=1&sn=0aaad3c6d856eb70f259a1b7099f28f1&chksm=fd92cdabcae544bd96afb27b20c9eafd604cc45b6efb1420fdd19f28626de376b8fb858ccc40&scene=21#wechat_redirect)  
[R 语言用主成分 PCA、逻辑回归、决策树、随机森林剖析心脏病数据并高维可视化](http://mp.weixin.qq.com/s?__biz=MzU4NTA1MDk4MA==&mid=2247496453&idx=1&sn=3f1b1a598dc451d9dd599ecbc20f7c4d&chksm=fd92cd0ecae54418486b1a5de02d094e26c0ef453829dd3c39220cb0fd2ec910989a3a8595f2&scene=21#wechat_redirect)  
[matlab 应用分位数随机森林(QRF)回归树检测异样值](http://mp.weixin.qq.com/s?__biz=MzU4NTA1MDk4MA==&mid=2247496258&idx=1&sn=37e17aad9615732d11a246b4a0e8cac1&chksm=fd92cc49cae5455f254c82ff12876e0ddee92e4dbcd87dd41e60c9914e7cb3b9e81076325e1a&scene=21#wechat_redirect)  
[R 语言用逻辑回归、决策树和随机森林对信贷数据集进行分类预测](http://mp.weixin.qq.com/s?__biz=MzU4NTA1MDk4MA==&mid=2247491694&idx=1&sn=f795dfe9c9eacfdd05ae887dfa687855&chksm=fd92de65cae55773872c8cc94cdefd0d93e8b726faf7c686866226f9a5013e83114c52629193&scene=21#wechat_redirect)  
[R 语言中应用线性模型、回归决策树主动组合特色因子程度](http://mp.weixin.qq.com/s?__biz=MzU4NTA1MDk4MA==&mid=2247490328&idx=3&sn=f016a6e47e7ddeaafb337860cc7641b7&chksm=fd912513cae6ac05782727c61b1fa9f53de4f32e6776cb59c0ca973dc51909a1c07ee5e6c6f7&scene=21#wechat_redirect)  
[R 语言中自编基尼系数的 CART 回归决策树的实现](http://mp.weixin.qq.com/s?__biz=MzU4NTA1MDk4MA==&mid=2247490194&idx=1&sn=f96e21f5b3bad1bb37efffdd6f41502f&chksm=fd912499cae6ad8fa9e097ccd11cea14999c8e4f13ffdebceb7fa2ec1d13dd2eaa014164fd08&scene=21#wechat_redirect)  
[Python 对商店数据进行 lstm 和 xgboost 销售量工夫序列建模预测剖析](http://mp.weixin.qq.com/s?__biz=MzU4NTA1MDk4MA==&mid=2247491318&idx=1&sn=72d5100f7c2c40acd77f7746019f7454&chksm=fd9120fdcae6a9ebc45c2d9eaab032b0f0f53d63ba79ecf432a423e1c5ee73e8d2b993290ae2&scene=21#wechat_redirect)  
[R 语言基于树的办法:决策树,随机森林,Bagging,加强树](http://mp.weixin.qq.com/s?__biz=MzU4NTA1MDk4MA==&mid=2247495111&idx=2&sn=3f3786e67254eb11588067696bd41960&chksm=fd92d3cccae55ada6bb2e24544b95d1f724cf2c7cd6cec6ce2f319957af253c51c9b04e4c2dc&scene=21#wechat_redirect)  
[R 语言实现偏最小二乘回归法 partial least squares (PLS)回归](http://mp.weixin.qq.com/s?__biz=MzU4NTA1MDk4MA==&mid=2247496903&idx=2&sn=34f27ec6e242d97b5abb9e2f3a7aefa6&chksm=fd92cacccae543da4614c8399715dd4ee4d51fbc046f56469ecde7ec24d6723a38a0d16c9899&scene=21#wechat_redirect)  
[R 语言多项式回归拟合非线性关系](http://mp.weixin.qq.com/s?__biz=MzU4NTA1MDk4MA==&mid=2247496815&idx=1&sn=9519d7eb3e57415c12f54232c116b10d&chksm=fd92ca64cae543727f2c46737f0e8e6dc7a3256eb58bf7e183f9ded61e704325954713ff8dc7&scene=21#wechat_redirect)  
[R 语言逻辑回归(Logistic 回归)模型分类预测病人冠心病危险](http://mp.weixin.qq.com/s?__biz=MzU4NTA1MDk4MA==&mid=2247496763&idx=1&sn=14524fe7bd95b3dd6e130c4f17b02bb8&chksm=fd92ca30cae543261cbb0a28273257ea478f5cd0eb15e32d01b9d9d54acf9e07c4bac9196425&scene=21#wechat_redirect)  
[R 语言用部分加权回归 (Lowess) 对 logistic 逻辑回归诊断和残差剖析](http://mp.weixin.qq.com/s?__biz=MzU4NTA1MDk4MA==&mid=2247496577&idx=1&sn=f9d866fa91dfdfad6c93e31d22bcaa38&chksm=fd92cd8acae5449c5ec6a0ac47fb52e958ca5d6e59151c92d3d14cf3b53a4376ea30912cc6c0&scene=21#wechat_redirect)  
正文完
 0