关于数据挖掘:Python在ScikitLearn可视化随机森林中的决策树分析房价数据

39次阅读

共计 933 个字符,预计需要花费 3 分钟才能阅读完成。

原文链接:http://tecdat.cn/?p=27050 

随机森林是决策树的汇合。在这篇文章中,我将向您展现如何从随机森林中可视化决策树。

首先让咱们在房价数据集上训练随机森林模型。

加载数据并训练随机森林。

X = pd.DataFrame(data, columns=feature_names)

让咱们将森林中的树数设置为 100:

RandomForestRegressor(n_estimators=100)

决策树存储在 模型 list 中的 estimators_ 属性中 rf。咱们能够查看列表的长度,它应该等于 n_estiamtors 值。

len(estimators_)



>>> 100

咱们能够从随机森林中绘制第一棵决策树(0 列表中有索引):

plot\_tree(rf.estimators\_\[0\])

这棵树太大,无奈在一个图中将其可视化。

让咱们查看随机森林中第一棵树的深度:

tree_.max_depth



>>> 16

咱们的第一棵树有 max_depth=16. 其余树也有相似的深度。为了使可视化具备可读性,最好限度树的深度。让咱们再次训练随机森林 max_depth=3

第一个决策树的可视化图:

plot\_tree(rf.estimators\_\[0\])

咱们能够可视化第一个决策树:

viz

概括

我将向您展现如何可视化随机森林中的单个决策树。能够通过 estimators_ 列表中的整数索引拜访树。有时当树太深时,值得用 max_depth 超参数限度树的深度。


 

最受欢迎的见解

1.PYTHON 用户散失数据挖掘:建设逻辑回归、XGBOOST、随机森林、决策树、反对向量机、奢侈贝叶斯模型和 KMEANS 聚类用户画像

2.R 语言基于树的办法:决策树,随机森林

3.python 中应用 scikit-learn 和 pandas 决策树

4. 机器学习:在 SAS 中运行随机森林数据分析报告

5.R 语言用随机森林和文本开掘进步航空公司客户满意度

6. 机器学习助推快时尚精准销售工夫序列

7. 用机器学习辨认一直变动的股市情况——隐马尔可夫模型的利用

8.python 机器学习:举荐零碎实现(以矩阵合成来协同过滤)

9.python 中用 pytorch 机器学习分类预测银行客户散失

正文完
 0