关于mysql:统计科学之多元回归分析

45次阅读

共计 1252 个字符,预计需要花费 4 分钟才能阅读完成。

01. 前言

后面咱们讲了一元线性回归,没看过的能够先去看看:[一元线性回归剖析]。这一篇咱们来讲讲多元线性回归。一元线性回归就是自变量只有一个 x,而多元线性回归就是自变量中有多个 x。

多元回归的模式如下:

02. 参数估计

多元回归方程中各个参数也是须要预计的,对于为什么要预计,其实咱们在一元线性回归外面也讲过。与一元线性回归不同的是,一元线性回归拟合的是一条线,而多元回归拟合的是一个面。应用的办法也是最小二乘法。

03. 拟合水平判断

在多元回归外面拟合水平判断与一元回归也相似,也次要有总平方和、回归平方和、残差平方和这三种。

多元回归外面也有 R^2,R^2 = SSR/SST = 1 – SSE/SST。因为减少自变量的会升高残差 SSE,进而导致 R^2 减少。

为什么退出新的变量会使 SSE 升高呢?因为每新退出一个新的变量,这个新的变量就会奉献一部分平方和,而这个平方和就是从残差外面分离出来的。

为了防止自觉减少自变量而导致失去一个虚高的 R^2,优良的前辈们又想出了一个新的指标,即修改后的 R^2。公式如下:

公式中的 n 为样本量的个数,k 为自变量的个数,通过 n 和 k 来调整 R^2,这样就不会呈现随着自变量个数的减少而导致 R^2 也跟着减少的状况。

咱们个别用调整后的 R^2 来判断多元回归的准确性。

除了 R^2 以外,咱们还能够应用标准误差来掂量回归模型的好坏。标准误差就是均方残差 (MSE) 的平方根,其示意依据各自变量 x 来预测因变量 y 的均匀预测误差。

04. 显著性测验

咱们在一元线性回归外面做过显著性测验,在多元回归外面也是同样须要做显著性判断的。

4.1 线性关系测验

线性关系测验就是测验 y 和多个 x 之间的关系是否显著,是总体显著性测验。

测验办法与一元线性回归统一,即咱们假如没有线性关系,而后对变量进行 F 测验,具体的具体介绍,参考一元线性回归中解说的。

4.2 回归系数测验

线性关系显著性测验是对多个变量的一个显著性判断,也就是说只有多个 x 中有一个 x 对 y 的影响是显著的,线性关系就是显著的。而回归系数测验是用来看每一个 x 对应的系数是否是显著的。要看某个变量的系数是否显著,假如这个变量的系数等于 0,而后进行 t 测验判断显著性。

具体的 t 测验能够查看假设检验的内容:[统计学的假设检验]。

05. 多重共线性

多元回归与一元回归还有一个不同点就是,多元回归有可能会存在多重共线性。

什么是多重共线性呢?多元回归外面咱们心愿是多个 x 别离对 y 起作用,也就是 x 别离与 y 相干。但在理论场景中,可能 x1 与 x2 之间彼此相干,咱们把这种 x 变量之间彼此相干的状况称为多重共线性。多重共线性可能会让回归失去一个谬误的后果。

既然多重共线性的问题很重大,那咱们应该如何发现呢?最简略的一种办法就是求变量之间的相关性,如果两个变量之间高度相干,就能够认为是存在多重共线性。

对于存在多重共线性问题的变量,咱们个别会把其中一个舍弃。

以上就是对于多元回归的一个简略介绍,大家能够看到很多内容没有开展来讲,次要是因为这些货色在之前的文章都讲过了。如果没有看过的同学,能够去后面对应的文章翻翻。

正文完
 0