关于mysql:统计科学之讲讲什么是异方差

2次阅读

共计 820 个字符,预计需要花费 3 分钟才能阅读完成。

明天咱们来讲一下异方差,在异方差以前,咱们先讲一下与异方差相似另一个概念:同方差,那同方差又是什么呢?同方差 = 雷同 + 方差,顾名思义就是方差雷同。那方差又是什么呢?方差是用来反映数据的稳定状况的,方差雷同,阐明数据的稳定状况是雷同的。讲完了同方差,那什么是异方差,大家应该也就明确了,异方差就是方差不雷同。

为什么要探讨异方差呢,是因为咱们在回归剖析和方差分析中都是假如样本之间是同方差的。在方差分析中,同方差是各组之间的方差相等;在回归剖析中,同方差是指对于每一个样本点来说,随机误差的平方和 (残差平方和) 是一样的。咱们在回归局部给大家讲过,残差平方和是回归值与理论值之间间隔的平方和,这一部分是除了自变量 X 影响之外的其余影响因素造成的,所以咱们把这一部分误差叫做随机误差,如果不同样本点之间受随机误差的影响是一样的,则随机误差平方和就是一样的,也就是同方差,反之则是异方差。

如下图反映的就是同方差,也就是不同受教育年限群体之间工资稳定状况是雷同的。

下图反映的就是异方差,也就是不同受教育年限群体之间工资稳定是不同的,受教育年限越长,工资稳定会越大;受教育年限越短,工资稳定会越小。

理解完了什么是异方差当前,咱们来看一下如何看不同样本点之间到底是同方差还是异方差呢?这就波及到异方差的测验了。测验异方差有描述统计办法和专门的统计测验办法,咱们这里次要给大家分享一下描述统计办法——看残差图。

残差图是以残差平方和为纵坐标,个别以回归拟合值 y 作为横坐标,当然也能够以其余自变量 x 作为横坐标,以下为几种不同类型的残差图:

下面这种类型的残差图:随着横轴的变动,纵轴围绕着一条水平线在稳定,阐明数据之间是满足同方差性的。

下面这种类型的残差图:随着横轴的增大,纵轴的数值在变小,阐明不同样本之间点之间的方差是不一样的,即异方差。

下面这种类型的残差图:横轴和残差之间是二次关系,也是异方差。

对于下面的残差图如何绘制,咱们在前面的回归实操局部给大家一起解说。

正文完
 0