关于python:统计学之T检验的种类与区别

44次阅读

共计 699 个字符，预计需要花费 2 分钟才能阅读完成。

咱们后面讲过，T 测验是用来比拟两个均值之间是否有显著差别的一种测验办法。这一篇给大家介绍一下 T 测验的品种以及具体的 Python 实现代码。T 测验是比拟两个均值差别的，不同品种 T 测验的差异其实在于均值的计算差别。

单样本 T 测验是用来测验一组样本的均值 A 与一个已知的均值 B 之间是否有差别。均值 A 是通过一组样本算进去的，均值 B 是已知的一个具体的值。如下图就是右边样本算进去的均值和值 158 的比照，此时的 t 统计量的公式为：

Python 实现代码如下：

from scipy import stats
stats.ttest_1samp(data,u)

运行下面的代码会返回 t 统计量值和对应的 p_value。

双样本 T 测验是用来测验两组样本的均值之间是否有差别。两个均值都是依据样本算进去的。如下图就是左右两局部样本算进去的均值，此时的 t 统计量的公式为：

Python 实现代码如下：

stats.ttest_ind(data1,data2)

配对样本 T 测验与双样本 T 测验有点相似，也是用来测验两组样本的均值差别，只不过一般双样本 T 测验中的样本是乱序的，而配对样本 T 测验中的样本是一一对应的。如下图所示，依据教训可得，周一至周五每天的销量不太一样，也不具备可比性，如果是双样本 T 测验的话就是将周一至周五的销量混在一起，而后对两组销量进行比照，然而这样显然是不太正当，正确的应该是周一和周一比，周二和周二比，总而言之，就是具备雷同属性的数据之间进行相比，而不是混合总体进行相比。此时的 t 统计量公式为：

Python 实现代码如下：