关于数据挖掘:R语言用GAM广义相加模型研究公交专用道对行程时间变异度数据的影响

36次阅读

共计 1410 个字符,预计需要花费 4 分钟才能阅读完成。

全文链接:http://tecdat.cn/?p=30508

原文出处:拓端数据部落公众号

现实情况是,咱们常常要解决多个自变量和一个因变量之间的关系,此外,尽管通过做散点图能够发现非线性关系,但很难归因其模式,多项式回归在狭义线性模型中,因为其不可解释的系数,升高了模型的有用性。

本文应用的狭义加性模型提供了一种首选计划来钻研多个自变量与因变量之间的关系,而无需当时理解因变量和自变量之间的关系,而是应用非线性平滑项来拟合模型。

GAM 模型阐明

狭义相加模型(GAM:Generalized Additive Model),它模型公式如下:有 p 个自变量,其中 X1 与 y 是线性关系,其余变量与 y 是非线性关系,咱们能够对每个变量与 y 拟合不同关系,对 X2 能够拟合部分回归,X3 采纳润滑样条,不用采纳对立的关系,而最终后果‘加’在一起就能够了。

钻研目标:

最近咱们被要求探讨公交专用道,工作日,向东方向,早顶峰,停驻工夫系数,延误系数对行程工夫变异度的影响。

预期后果

所有因素中,公交专用道 对 行程工夫变异度 的影响最大,且能够缩小行程工夫变异度。

变量阐明

序号自变量变量类型
1公交专用道[0.1]()变量
2工作日0.1 变量
3向东方向0.1 变量
4早顶峰0.1 变量
5信号灯离散变量 整数
6延误系数连续变量
7行程工夫可靠性连续变量

应用 poisson(link = “log”)# 连贯函数

让咱们应用 summary 函数对第一个模型进行诊断。

P 值:给定变量对因变量的统计显着性,通过 F 测验进行测验(越低越好)。调整后的 R 平方(越高越好)。
s()是样条函数,括号外面的数字是定义的自由度,除了应用回归样条,还能应用部分样条 lo()函数,失去的后果与下面的后果非常相似。

采纳 plot()能够将模型画进去,图横坐标为自变量 X,纵坐标为因变量 Y。

不应用 poisson 连贯函数

让咱们应用 summary 函数进行诊断。

P 值:给定变量对因变量的统计显着性,通过 F 测验进行测验(越低越好)。从后果能够看到公交专用道对行程工夫变异度有显著影响。

    • *

最受欢迎的见解

1.[](http://tecdat.cn/r%e8%af%ad%e…)R 语言多元 Logistic 逻辑回归 利用案例

2.[](http://tecdat.cn/r%e8%af%ad%e…)面板平滑转移回归 (PSTR) 剖析案例实现

3.[](http://tecdat.cn/r%e8%af%ad%e…)matlab 中的偏最小二乘回归(PLSR)和主成分回归(PCR)

4.[](http://tecdat.cn/r%e8%af%ad%e…)R 语言泊松 Poisson 回归模型剖析案例

5.[](http://tecdat.cn/r%e8%af%ad%e…)R 语言回归中的 Hosmer-Lemeshow 拟合优度测验

6.[](http://tecdat.cn/r%e8%af%ad%e…)r 语言中对 LASSO 回归,Ridge 岭回归和 Elastic Net 模型实现

7.[](http://tecdat.cn/r-%e8%af%ad%…)在 R 语言中实现 Logistic 逻辑回归

8.[](http://tecdat.cn/r%e8%af%ad%e…)python 用线性回归预测股票价格

9.[](http://tecdat.cn/r%e8%af%ad%e…)R 语言如何在生存剖析与 Cox 回归中计算 IDI,NRI 指标

正文完
 0