01.前言
后面咱们讲了一元线性回归,没看过的能够先去看看:[一元线性回归剖析]。这一篇咱们来讲讲多元线性回归。一元线性回归就是自变量只有一个x,而多元线性回归就是自变量中有多个x。
多元回归的模式如下:
02.参数估计
多元回归方程中各个参数也是须要预计的,对于为什么要预计,其实咱们在一元线性回归外面也讲过。与一元线性回归不同的是,一元线性回归拟合的是一条线,而多元回归拟合的是一个面。应用的办法也是最小二乘法。
03.拟合水平判断
在多元回归外面拟合水平判断与一元回归也相似,也次要有总平方和、回归平方和、残差平方和这三种。
多元回归外面也有R^2,R^2 = SSR/SST = 1 - SSE/SST。因为减少自变量的会升高残差SSE,进而导致R^2减少。
为什么退出新的变量会使SSE升高呢?因为每新退出一个新的变量,这个新的变量就会奉献一部分平方和,而这个平方和就是从残差外面分离出来的。
为了防止自觉减少自变量而导致失去一个虚高的R^2,优良的前辈们又想出了一个新的指标,即修改后的R^2。公式如下:
公式中的n为样本量的个数,k为自变量的个数,通过n和k来调整R^2,这样就不会呈现随着自变量个数的减少而导致R^2也跟着减少的状况。
咱们个别用调整后的R^2来判断多元回归的准确性。
除了R^2以外,咱们还能够应用标准误差来掂量回归模型的好坏。标准误差就是均方残差(MSE)的平方根,其示意依据各自变量x来预测因变量y的均匀预测误差。
04.显著性测验
咱们在一元线性回归外面做过显著性测验,在多元回归外面也是同样须要做显著性判断的。
4.1线性关系测验
线性关系测验就是测验y和多个x之间的关系是否显著,是总体显著性测验。
测验办法与一元线性回归统一,即咱们假如没有线性关系,而后对变量进行F测验,具体的具体介绍,参考一元线性回归中解说的。
4.2回归系数测验
线性关系显著性测验是对多个变量的一个显著性判断,也就是说只有多个x中有一个x对y的影响是显著的,线性关系就是显著的。而回归系数测验是用来看每一个x对应的系数是否是显著的。要看某个变量的系数是否显著,假如这个变量的系数等于0,而后进行t测验判断显著性。
具体的t测验能够查看假设检验的内容:[统计学的假设检验]。
05.多重共线性
多元回归与一元回归还有一个不同点就是,多元回归有可能会存在多重共线性。
什么是多重共线性呢?多元回归外面咱们心愿是多个x别离对y起作用,也就是x别离与y相干。但在理论场景中,可能x1与x2之间彼此相干,咱们把这种x变量之间彼此相干的状况称为多重共线性。多重共线性可能会让回归失去一个谬误的后果。
既然多重共线性的问题很重大,那咱们应该如何发现呢?最简略的一种办法就是求变量之间的相关性,如果两个变量之间高度相干,就能够认为是存在多重共线性。
对于存在多重共线性问题的变量,咱们个别会把其中一个舍弃。
以上就是对于多元回归的一个简略介绍,大家能够看到很多内容没有开展来讲,次要是因为这些货色在之前的文章都讲过了。如果没有看过的同学,能够去后面对应的文章翻翻。