关于数据挖掘:Python用机器学习算法进行因果推断与增量增益模型Uplift-Modeling智能营销模型

5次阅读

共计 1332 个字符,预计需要花费 4 分钟才能阅读完成。

原文链接:http://tecdat.cn/?p=27058 

应用 ML 进行晋升建模和因果推理。

Python 包提供了一套应用基于最近钻研的机器学习算法的晋升建模和因果推理方法。容许用户依据试验或察看数据预计条件均匀解决成果 (CATE) 或个体解决成果 (ITE)。实质上,它预计了干涉 对 具备察看特色的用户的 T 后果 的因果影响,而对模型模式没有强烈的假如。典型用例包含

  • 
    ** 广告流动定位优化 **:在广告流动中进步投资回报率的一个重要伎俩是将广告定位到在给定 KPI(如参与度或销售量)中会有良好反馈的客户群。通过依据 A/B 试验或历史察看数据在集体层面预计广告曝光的 KPI 影响来辨认这些客户。
  • 
    ** 个性化参加 **:公司有多种抉择与客户互动,例如在追加销售或音讯渠道中的不同产品抉择。能够预计每个客户和解决选项组合的异质解决成果,以获得最佳的个性化举荐零碎。

目前反对以下办法

  • 
    ** 基于树的算法 **
    ==========
    
  • 欧几里得间隔和卡方上的随机森林

  • 晋升树 / 随机森林

  • 
    ** 元学习算法 **
    =========
    
  • S 学习

  • T 学习

  • X 学习

  • R 学习

  • 
    ** 工具变量算法 **
    ==========
    
  • 2 阶段最小二乘法 (2SLS)

开始

S、T、X 和 R 学习的均匀解决成果预计

xg = XGBTRrssor()



nn = MLPTReesor(hidenlayer_izes=(10, 10))





xl = BaeXegrsor(lernr=XGBeresor())





rl = BaeRReresor(lerner=XRegrssor())

可解释的因果机器学习

提供了解释如下训练的解决成果模型的办法:

元学习特色的重要性

# 加载合成数据

np.array(\['treaet_A' if x==1 else 'cotol' for x in trtent\]) # 解决 / 管制名称







RnFostRgesor()  # 为 model\_tau\_feature 指定模



# 在根底学习器中应用 feature\_importances\_办法

plot_ipornce()





# 绘制 shap 值

pot\_shp\_ues()





# interaction_idx 设置为 'auto'

ploshp_dpedece()

晋升树可视化

uplit_del.fit(df\[fars\].values,

                 trtnt=df\['trtme\_rop\_ey'\].values,

                 y=df\['cvesin'\].values)


 最受欢迎的见解

1.PYTHON 用户散失数据挖掘:建设逻辑回归、XGBOOST、随机森林、决策树、反对向量机、奢侈贝叶斯模型和 KMEANS 聚类用户画像

2.R 语言基于树的办法:决策树,随机森林

3.python 中应用 scikit-learn 和 pandas 决策树

4. 机器学习:在 SAS 中运行随机森林数据分析报告

5.R 语言用随机森林和文本开掘进步航空公司客户满意度

6. 机器学习助推快时尚精准销售工夫序列

7. 用机器学习辨认一直变动的股市情况——隐马尔可夫模型的利用

8.python 机器学习:举荐零碎实现(以矩阵合成来协同过滤)

9.python 中用 pytorch 机器学习分类预测银行客户散失

正文完
 0