原文链接：http://tecdat.cn/?p=23170

简介

本文与以下两个问题无关。你应该如何增加虚构变量？你应该如何解释后果？

如果应用一个例子，咱们可能会更容易了解这些问题。

数据

假如咱们想钻研工资是如何由教育、教训和某人是否负责治理职务决定的。假如

每个人都从年薪4万开始。
实际出真知。每减少一年的教训，工资就减少5千。
你学得越多，你的支出就越多。高中、大学和博士的年薪增长别离为0、10k和20k。
海面平静时，任何人都能够掌舵。对于负责治理职位的人，要多付20k。
天生就是平凡的领导者。对于那些只上过高中却负责治理职位的人，多给他们3万。
随机因素会影响工资，平均值为0，标准差为5千。

上面是局部数据和摘要。

绘制数据

有和没有治理职位的人的工资和教育之间的关系。

 jitter(alpha=0.25,color=colpla\[4\])+
  facet_wrap(~治理职位)+
boxplot(color=colpla\[2\])

有治理职位和没有治理职位的人的工资和教训之间的关系，以教育为根底。

 stat_smooth(method = "lm")+
  facet_wrap(~治理职位)

回归剖析

疏忽教育和治理之间的相互作用

咱们只将工资与教育、教训和治理职位进行回归。其后果是

尽管这些参数在统计学上是有意义的，但这并没有任何意义。与高中相比，大学学历怎么可能使你的工资缩小5105？

正确的模型应该包含教育和治理职位的交互项。

增加教育和治理之间的交互作用

当初，让咱们增加教育和治理之间的交互项，看看会产生什么。

对后果的解释

当初的后果是有意义的。

截距为40137（靠近4万）是基本保障支出。
教育的基数是高中。与高中相比，大学教育能够均匀减少9833元（靠近1万）的工资。与高中相比，博士教育能够减少19895元（靠近2万）的工资。
多一年的工作教训能够使工资减少4983元（靠近5千）。
负责治理职位的高中毕业生有49695元的溢价（靠近5万）。这些人是天生的领导者。
与负责治理职位的高中毕业生相比，负责治理职位的大学毕业生的溢价缩小了29965.51至29571（49735.74-29965.51，靠近2万）。
与高中毕业生负责治理职位相比，博士毕业生负责治理职位的溢价缩小了29501至19952.87（靠近2万）。另外，你能够说治理职位产生了20K的根本溢价，而不思考教育程度。除了这2万外，高中毕业生还能失去3万，使总溢价减少到5万。

测验是否违反了模型的假如

为了使咱们的模型无效，咱们须要满足一些假如。

误差应该遵循正态分布

正态Q-Q图看起来是线性的。所以这个假如失去了满足。

没有自相干

D-W测验值为1.8878，靠近2，因而，这个假如也满足。

没有多重共线性

预测变量edu、exp和mngt的VIF值均小于5，因而满足这一假如。

用数据的子集进行回归

你能够通过用一个数据子集运行模型来取得同样的后果。你能够将数据按教育水平分成子集，并在每个子集上运行回归模型，而不是应用一个教育的虚构变量。

如果只用高中生的数据，你会失去这样的后果。

sub<-d %>% 
+   filter(教育=="高中")

仅凭大学生的数据，你就能失去这个后果。

只用来自博士生的数据，你会失去这个后果。

最受欢迎的见解

1.R语言多元Logistic逻辑回归利用案例

2.面板平滑转移回归(PSTR)剖析案例实现

3.matlab中的偏最小二乘回归（PLSR）和主成分回归（PCR）

4.R语言泊松Poisson回归模型剖析案例

5.R语言混合效应逻辑回归Logistic模型剖析肺癌

6.r语言中对LASSO回归，Ridge岭回归和Elastic Net模型实现

7.R语言逻辑回归、Naive Bayes贝叶斯、决策树、随机森林算法预测心脏病

8.python用线性回归预测股票价格

9.R语言用逻辑回归、决策树和随机森林对信贷数据集进行分类预测

关于算法:R语言使用虚拟变量Dummy-Variables-回归分析工资影响因素

原文链接：http://tecdat.cn/?p=23170

简介

数据

绘制数据

回归剖析

疏忽教育和治理之间的相互作用

增加教育和治理之间的交互作用

对后果的解释

测验是否违反了模型的假如

用数据的子集进行回归

评论

发表回复取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

关于算法:R语言使用虚拟变量Dummy-Variables-回归分析工资影响因素

原文链接：http://tecdat.cn/?p=23170

简介

数据

绘制数据

回归剖析

疏忽教育和治理之间的相互作用

增加教育和治理之间的交互作用

对后果的解释

测验是否违反了模型的假如

用数据的子集进行回归

评论

发表回复 取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

发表回复取消回复