共计 1742 个字符,预计需要花费 5 分钟才能阅读完成。
原文链接: http://tecdat.cn/?p=25939
最近咱们被客户要求撰写对于多输入(多因变量)回归的钻研报告,包含一些图形和统计输入。
在之前的文章中,咱们钻研了许多应用 多输入回归剖析的办法。在本教程中,咱们将学习如何应用梯度晋升决策树 GRADIENT BOOSTING REGRESSOR 拟合和预测多输入回归数据。对于给定的 x 输出数据,多输入数据蕴含多个指标标签。本教程涵盖:
- 筹备数据
- 定义模型
- 预测和可视化后果
咱们将从加载本教程所需的库开始。
**
拓端
,赞 30
**
拓端
,赞 16
筹备数据
首先,咱们将为本教程创立一个多输入数据集。它是随机生成的数据,具备以下一些规定。该数据集中有三个输出和两个输入。咱们将绘制生成的数据以直观地查看它。
f = plt.figure()
f.add_subplot(1,2,1)
plt.title("Xs 输出数据")
plt.plot(X)
接下来,咱们将数据集拆分为训练和测试局部并检查数据形态。
print("xtrain:", xtrain.shape, "ytrian:", ytrain.shape)
点击题目查阅往期内容
R 语言样条曲线、决策树、Adaboost、梯度晋升 (GBM) 算法进行回归、分类和动静可视化
左右滑动查看更多
01
02
03
04
定义模型
咱们将定义模型。作为预计,咱们将应用默认参数实现。能够通过 print 命令查看模型的参数。
model = MutRer(es=gbr)
print(model)
当初,咱们能够用训练数据拟合模型并查看训练后果。
fit(xtrain, ytrain)
score(xtrain, ytrain)
预测和可视化后果
咱们将应用经过训练的模型预测测试数据,并查看 y1 和 y2 输入的 MSE 率。
predict
\
最初,咱们将在图中可视化后果并直观地查看它们。
xax = range(len)
plt.plot
plt.legend
在本教程中,咱们简要学习了如何在 Python 中训练了多输入数据集和预测的测试数据。
本文摘选 《 Python 进行多输入(多因变量)回归:集成学习梯度晋升决策树 GRADIENT BOOSTING REGRESSOR 回归训练和预测可视化 》,点击“ 浏览原文”获取全文残缺材料。
点击题目查阅往期内容
样条曲线、决策树、Adaboost、梯度晋升 (GBM) 算法进行回归、分类和动静可视化 \
PYTHON 集成学习:本人编写构建 ADABOOST 分类模型可视化决策边界及 SKLEARN 包调用比拟 \
PYTHON 用户散失数据挖掘:建设逻辑回归、XGBOOST、随机森林、决策树、反对向量机、奢侈贝叶斯和 KMEANS 聚类用户画像 \
PYTHON 集成机器学习:用 ADABOOST、决策树、逻辑回归集成模型分类和回归和网格搜寻超参数优化 \
R 语言集成模型:晋升树 boosting、随机森林、束缚最小二乘法加权均匀模型交融剖析工夫序列数据 Python 对商店数据进行 lstm 和 xgboost 销售量工夫序列建模预测剖析 \
R 语言用主成分 PCA、逻辑回归、决策树、随机森林剖析心脏病数据并高维可视化 \
R 语言基于树的办法:决策树,随机森林,Bagging,加强树 \
R 语言用逻辑回归、决策树和随机森林对信贷数据集进行分类预测 \
spss modeler 用决策树神经网络预测 ST 的股票 \
R 语言中应用线性模型、回归决策树主动组合特色因子程度 \
R 语言中自编基尼系数的 CART 回归决策树的实现 \
R 语言用 rle,svm 和 rpart 决策树进行工夫序列预测 \
python 在 Scikit-learn 中用决策树和随机森林预测 NBA 获胜者 \
python 中应用 scikit-learn 和 pandas 决策树进行 iris 鸢尾花数据分类建模和穿插验证 \
R 语言里的非线性模型:多项式回归、部分样条、平滑样条、狭义相加模型 GAM 剖析 \
R 语言用规范最小二乘 OLS,狭义相加模型 GAM,样条函数进行逻辑回归 LOGISTIC 分类 \
R 语言 ISLR 工资数据进行多项式回归和样条回归剖析 \
R 语言中的多项式回归、部分回归、核平滑和平滑样条回归模型 \
R 语言用泊松 Poisson 回归、GAM 样条曲线模型预测骑自行车者的数量 \
R 语言分位数回归、GAM 样条曲线、指数平滑和 SARIMA 对电力负荷工夫序列预测