关于数据挖掘:R语言分位数回归最小二乘回归OLS北京市GDP影响因素可视化分析

33次阅读

共计 3147 个字符,预计需要花费 8 分钟才能阅读完成。

全文链接:http://tecdat.cn/?p=32372

原文出处:拓端数据部落公众号

对于影响北京市 GDP 因素剖析罕用的办法是最小二乘回归。【1】但最小二乘有本身的缺点,该办法要求较高,例如许多观测数据很难满足全副假如条件。相比一般最小二乘法只能形容协变量对因变量条件均值变动的影响,分位数回归能准确地形容协变量对于因变量的变动范畴和散布形态的影响。【2】随着计算机技术的一直冲破, 分位数回归软件包现已是支流统计软件 R、SAS 等中的阶下囚了, 分位数回归也就自然而然地成为经济、医学、教育等畛域的罕用剖析工具。【3】

客户次要钻研是先利用分位数回归钻研收敛性,而后和最小二乘做个比拟。

钻研意义

作为一种准确地形容自变量对于因变量的变动范畴以及条件散布影响的统计办法,分位数回归的概念最早由 Koenker 和 Basset(t1978)【4】提出。借助 Laplace(1818)提出的最小相对残差预计思维,他们针对最小二乘回归的某些缺点,创立了线性分位数回归实践。Bassett(1986)【5】、Powell(1986)【6】和 Chernozhuko(2002)【7】等人在此基础上进行了深刻的钻研,陆续解决了分位数回归的线性假设检验、异方差的稳健性测验、估计量的一致性和线性规划解法等利用方面的难题,使其成为了近几十年来倒退较快、利用宽泛的回归模型办法。分位数回归能够提供不同分位点处的预计后果,因而能够对因变量的整个分配情况作出更为分明的阐释。【8】不同分位数下的参数估计量往往也不同,这就表明同样的影响因素对处在不同程度的钻研对象的作用大小是不同的。特地是在钻研对象的散布出现异质性,如不对称,截断性等特色时,这一办法往往可能提供更为详尽的信息,具备显著的劣势。【9】

文献综述

分位数回归是对以古典条件均值模型为根底的最小二乘法的延长, 它用几个分位函数来预计整体模型。分位数回归更能准确地形容自变量 X 对于因变量 Y 的变动范畴以及条件散布形态的影响。分位数回归可能捕获散布的尾部特色,当自变量对不同局部的因变量的散布产生不同的影响时。【10】

对于分位数回归模型,则可采取线性规划法(LP)预计其最小加权相对偏差,从而失去解释变量的回归系数,可示意如下:

求解得:

钻研的根本内容,拟解决的次要问题

钻研的次要内容:

1.   对北京市 1995~2014 年的 GDP、投资、生产等增长率进行统计;

2.   建设分位数回归模型;

3.   探讨模型的稳健性、解决数据异质性、各种收敛性;

4.   针对不同的收敛性进行剖析和比拟;

5.   通过与最小二乘法的比照钻研其劣势。

钻研步骤

1.      收集北京市近二十年经济增长等数据;

2.      学习并理解分位数回归剖析问题的钻研背景及利用;

3.      建设分位数回归模型;

4.      利用模型与统计软件进行计算,察看其个性;

5.      与最小二乘法进行比拟,得出结论。

查看数据

读取数据

head(data)

σ 收敛的测验

从变异系数的变化趋势来看,在 06 年当前,稳定趋势变小,因而参数逐步收敛。

β- 收敛的分位数回归剖析

ggplot(dat, aes(x,y)) + geom_point() + geom_smooth(method="lm")

建设分位数回归模型

qr1 <- rq

qr1$coefficients

与 ols 回归线段作比拟

summary(OLS)

OLS(一般二乘回归)

上图是一般二乘回归的拟合图,从后果来看大部分点被回归预测的置信区间所笼罩。而后有大量点在置信区间之外。

分位数回归拟合直线

分位数回归图

从分位数回归的后果来看,所有数据均被分位数回归模型的预测区间所笼罩。因而模型比一般二乘更好。

下面的图为分位数回归的回归系数变化趋势图,从后果来看居民消费程度的相干影响逐步变动且从负相关变为正相干,阐明有正向的影响,社会投资从正相干逐步变成负相关,阐明有负向的影响,进出口总额从负相关逐步变成正相干,阐明有正向的影响。

参考文献

[1]刘丽华,刘尧. 基于回归剖析的人均 GDP 影响因素钻研[J] . 经济钻研导刊. 2013 (7) .

[2]沈冰. 基于面板数据的分位数回归剖析——浙江省 GDP 的影响因素[J]. 财经纵览_财政金融(2015 年 10 期).

[3]李育安. 分位数回归及利用简介[J]. 统计与信息论坛 第 21 卷第 3 期(006 年 5 月).

[4]Koenker, Bassett. Regression Quantiles[J]. Econometrica, 1978, (46).

[5]Bassett , Koenker. Strong Consistency of Regression Quantiles and   Related Empirical Processes[J]. Econometric Theory , 1986, (2).

[6]Powell , James L. Censored Regression Quantiles[J].Journal of Econo-metrics, 1986, (32).

[7]Hong H , Chernozhukov V. Three-Step Censored Quantile Regression and Extramarital Affairs[J] . Journal of the American Statistical Asso-ciation, 2002, (97).

[8]李群峰.  基于分位数回归的面板数据模型预计办法[J]. 统计与决策. 2011(17)

[9]黄蓓、范悍彪,宋峰. 中国地区经济增长收敛性分位数回归剖析[J]. 安徽财经大学

[10]姜成飞. 分位数回归办法综述[J]. 科技信息(2013 年 25 期)


最受欢迎的见解

1.[](http://tecdat.cn/r%e8%af%ad%e8%a8%80%e7%bb%98%e5%88%b6%e7%94%…)R 语言多元 Logistic 逻辑回归 利用案例

2.[](http://tecdat.cn/r%e8%af%ad%e8%a8%80%e7%94%9f%e5%ad%98%e5%88%…)面板平滑转移回归 (PSTR) 剖析案例实现

3.[](http://tecdat.cn/r%e8%af%ad%e8%a8%80%e5%a6%82%e4%bd%95%e5%9c%…)matlab 中的偏最小二乘回归(PLSR)和主成分回归(PCR)

4.[](http://tecdat.cn/r%e8%af%ad%e8%a8%80%e4%b8%ad%e4%bd%bf%e7%94%…)R 语言泊松 Poisson 回归模型剖析案例

5.[](http://tecdat.cn/r%e8%af%ad%e8%a8%80%e7%94%9f%e5%ad%98%e5%88%…)R 语言回归中的 Hosmer-Lemeshow 拟合优度测验

6.[](http://tecdat.cn/r%e8%af%ad%e8%a8%80ggplot2%e8%af%af%e5%b7%ae…)r 语言中对 LASSO 回归,Ridge 岭回归和 Elastic Net 模型实现

7.[](http://tecdat.cn/r-%e8%af%ad%e8%a8%80%e7%bb%98%e5%88%b6%e5%8a…)在 R 语言中实现 Logistic 逻辑回归

8.[](http://tecdat.cn/r%e8%af%ad%e8%a8%80%e5%a6%82%e4%bd%95%e6%89%…)python 用线性回归预测股票价格

9.[](http://tecdat.cn/r%e8%af%ad%e8%a8%80%e4%b8%ad%e7%9a%84%e7%94%…)R 语言如何在生存剖析与 Cox 回归中计算 IDI,NRI 指标

正文完
 0