全文链接:http://tecdat.cn/?p=30508

原文出处:拓端数据部落公众号

现实情况是,咱们常常要解决多个自变量和一个因变量之间的关系,此外,尽管通过做散点图能够发现非线性关系,但很难归因其模式,多项式回归在狭义线性模型中,因为其不可解释的系数,升高了模型的有用性。

本文应用的狭义加性模型提供了一种首选计划来钻研多个自变量与因变量之间的关系,而无需当时理解因变量和自变量之间的关系,而是应用非线性平滑项来拟合模型。

GAM模型阐明

狭义相加模型(GAM:Generalized Additive Model),它模型公式如下:有p个自变量,其中X1与y是线性关系,其余变量与y是非线性关系,咱们能够对每个变量与y拟合不同关系,对X2能够拟合部分回归,X3采纳润滑样条,不用采纳对立的关系,而最终后果‘加’在一起就能够了。

钻研目标:

最近咱们被要求探讨公交专用道,工作日,向东方向,早顶峰,停驻工夫系数,延误系数对行程工夫变异度的影响。

预期后果

所有因素中,公交专用道 对 行程工夫变异度 的影响最大,且能够缩小行程工夫变异度。

变量阐明

序号自变量变量类型
1公交专用道[0.1 ]()变量
2工作日0.1 变量
3向东方向0.1 变量
4早顶峰0.1 变量
5信号灯离散变量 整数
6延误系数连续变量
7行程工夫可靠性连续变量

应用poisson(link = "log")#连贯函数

让咱们应用summary函数对第一个模型进行诊断。

P值:给定变量对因变量的统计显着性,通过F测验进行测验(越低越好)。调整后的R平方(越高越好)。
s()是样条函数,括号外面的数字是定义的自由度,除了应用回归样条,还能应用部分样条lo()函数,失去的后果与下面的后果非常相似。


采纳plot()能够将模型画进去,图横坐标为自变量X,纵坐标为因变量Y。

不应用poisson连贯函数

让咱们应用summary函数进行诊断。


P值:给定变量对因变量的统计显着性,通过F测验进行测验(越低越好)。从后果能够看到公交专用道对行程工夫变异度有显著影响。

    • *


最受欢迎的见解

1.[](http://tecdat.cn/r%e8%af%ad%e...)R语言多元Logistic逻辑回归 利用案例

2.[](http://tecdat.cn/r%e8%af%ad%e...)面板平滑转移回归(PSTR)剖析案例实现

3.[](http://tecdat.cn/r%e8%af%ad%e...)matlab中的偏最小二乘回归(PLSR)和主成分回归(PCR)

4.[](http://tecdat.cn/r%e8%af%ad%e...)R语言泊松Poisson回归模型剖析案例

5.[](http://tecdat.cn/r%e8%af%ad%e...)R语言回归中的Hosmer-Lemeshow拟合优度测验

6.[](http://tecdat.cn/r%e8%af%ad%e...)r语言中对LASSO回归,Ridge岭回归和Elastic Net模型实现

7.[](http://tecdat.cn/r-%e8%af%ad%...)在R语言中实现Logistic逻辑回归

8.[](http://tecdat.cn/r%e8%af%ad%e...)python用线性回归预测股票价格

9.[](http://tecdat.cn/r%e8%af%ad%e...)R语言如何在生存剖析与Cox回归中计算IDI,NRI指标