咱们后面讲过,T测验是用来比拟两个均值之间是否有显著差别的一种测验办法。这一篇给大家介绍一下T测验的品种以及具体的Python实现代码。T测验是比拟两个均值差别的,不同品种T测验的差异其实在于均值的计算差别。
1.单样本T测验
单样本T测验是用来测验一组样本的均值A与一个已知的均值B之间是否有差别。均值A是通过一组样本算进去的,均值B是已知的一个具体的值。如下图就是右边样本算进去的均值和值158的比照,此时的t统计量的公式为:
Python实现代码如下:
from scipy import statsstats.ttest_1samp(data,u)
运行下面的代码会返回t统计量值和对应的p_value。
2.双样本T测验
双样本T测验是用来测验两组样本的均值之间是否有差别。两个均值都是依据样本算进去的。如下图就是左右两局部样本算进去的均值,此时的t统计量的公式为:
Python实现代码如下:
stats.ttest_ind(data1,data2)
3.配对样本T测验
配对样本T测验与双样本T测验有点相似,也是用来测验两组样本的均值差别,只不过一般双样本T测验中的样本是乱序的,而配对样本T测验中的样本是一一对应的。如下图所示,依据教训可得,周一至周五每天的销量不太一样,也不具备可比性,如果是双样本T测验的话就是将周一至周五的销量混在一起,而后对两组销量进行比照,然而这样显然是不太正当,正确的应该是周一和周一比,周二和周二比,总而言之,就是具备雷同属性的数据之间进行相比,而不是混合总体进行相比。此时的t统计量公式为:
Python实现代码如下:
stats.ttest_rel(data1,data2)