咱们后面讲过,T 测验是用来比拟两个均值之间是否有显著差别的一种测验办法。这一篇给大家介绍一下 T 测验的品种以及具体的 Python 实现代码。T 测验是比拟两个均值差别的,不同品种 T 测验的差异其实在于均值的计算差别。
1. 单样本 T 测验
单样本 T 测验是用来测验一组样本的均值 A 与一个已知的均值 B 之间是否有差别。均值 A 是通过一组样本算进去的,均值 B 是已知的一个具体的值。如下图就是右边样本算进去的均值和值 158 的比照,此时的 t 统计量的公式为:
Python 实现代码如下:
from scipy import stats
stats.ttest_1samp(data,u)
运行下面的代码会返回 t 统计量值和对应的 p_value。
2. 双样本 T 测验
双样本 T 测验是用来测验两组样本的均值之间是否有差别。两个均值都是依据样本算进去的。如下图就是左右两局部样本算进去的均值,此时的 t 统计量的公式为:
Python 实现代码如下:
stats.ttest_ind(data1,data2)
3. 配对样本 T 测验
配对样本 T 测验与双样本 T 测验有点相似,也是用来测验两组样本的均值差别,只不过一般双样本 T 测验中的样本是乱序的,而配对样本 T 测验中的样本是一一对应的。如下图所示,依据教训可得,周一至周五每天的销量不太一样,也不具备可比性,如果是双样本 T 测验的话就是将周一至周五的销量混在一起,而后对两组销量进行比照,然而这样显然是不太正当,正确的应该是周一和周一比,周二和周二比,总而言之,就是具备雷同属性的数据之间进行相比,而不是混合总体进行相比。此时的 t 统计量公式为:
Python 实现代码如下:
stats.ttest_rel(data1,data2)