关于mysql:统计科学之方差齐性检验

60次阅读

共计 1260 个字符,预计需要花费 4 分钟才能阅读完成。

1. 前言

咱们在方差分析外面有讲过,方差分析有一个很重要的前提就是叫方差齐性。这一篇来讲讲如何来测验方差齐性。

先讲讲什么是方差齐性,方差齐性是指不同组间的总体方差是一样的。那为什么方差分析的前提是要组间的总体方差保持一致呢?先想想方差分析是做什么呢?方差分析是用来比拟多组之间均值是否存在显著差别。那如果方差不统一,也就意味着值的稳定水平是不一样的,如果此时均值之间存在显著差别,不可能阐明肯定是不同组间解决带来的,有可能是大方差带来大的稳定;如果方差一样,也就意味着值的稳定水平是一样的,在雷同稳定水平下,间接去比拟均值,如果均值之间存在显著差别,那么能够认为是不同组间解决带来的。

方差齐性测验是对两组样本的方差是否雷同进行测验。测验思维与均值之间差异性测验是一样的。罕用的办法有:方差比、Hartley 测验、Levene 测验、BF 法、Bartlett 测验。

2. 方差比

方差比顾名思义就是两组方差的比,用较大一组的方差除较小一组的方差,最初失去一个 F 值,而后依据 F 值的大小来判断两组之间的方差是否相等。F 值越大,则认为两组方差越不相等。

3.Hartley 测验

Hartley 测验与方差比的思维比拟相似,差异在于 Hartley 测验用于多组方差的测验,用多组中最大的方差除最小的方差,失去一个 F 值,而后通过 F 值的判断来对方差齐性进行判断。

4.Levene 测验

Levene 测验是将每个值先转换为为该值与其组内均值的偏离水平,而后再用转换后的偏离水平去做方差分析,即组间方差 / 组内方差。

在这里对于组内均值有多种计算形式:平均数、中位数、截取平均数 (去掉最大和最小值后求均匀)。

在 Python 中有现成的函数能够应用:

from scipy.stats import levene
stat, p = levene(x, y, z)
print(stat, p)

下面公式中 x、y、z 代表不同组的样本。

5.BF 法

Levene 测验最开始计算组内均值的时候只是用了组内平均数,起初又有名叫 Brown 和 Forsythe 的两位前辈对齐进行了革新,增加了中位数和截取均值的办法,简称 BF 法。

这个在 Python 外面用的也是 levene 函数,通过调整参数的取值即可。

6.Bartlett 测验

Bartlett 测验的核心思想是通过求取不同组之间的卡方统计量,而后依据卡方统计量的值来判断组间方差是否相等。该办法极度依赖于数据是正态分布,如果数据非正态分布,则的进去的后果偏差很大。

在 Python 中有现成的函数能够应用:

from scipy.stats import bartlett
stat, p = bartlett(x, y, z)
print(stat, p)

下面公式中 x、y、z 代表不同组的样本。

7. 总结

后面介绍了好几种办法,最初来总结下这几种办法的利弊及实用条件:方差比、Hartley 测验、Bartlett 测验都须要原始数据是正态分布,Levene 测验和 BF 法对正态分布不是很依赖。比拟罕用的是 Levene 测验,实用于多组方差的比拟,且对正态性没要求。

正文完
 0