这一篇咱们讲讲统计中的最小样本量计算。大家先想想为什么叫最小样本量,而不是最大或者间接叫样本量计算呢?
这是因为最小样本量这个概念次要用在抽样统计中,抽样统计为了钻研某一事物的状况而从整体中抽取局部样本来进行钻研,并用抽取的样本来代替整体的状况。比方要钻研中学生的均匀身高,你不太可能把全国的中学生身高都量一遍,而后求出一个平均值。比较简单的办法就是从全国中学生群体中抽取一部分,而后用这一部分同学的均匀身高代替全国中学生的均匀身高。
既然是用抽样样本的均匀身高代替整体的均匀身高,咱们就须要思考一个问题,就是抽出来的样本能不能代表整体。假如全国有 1000 万名中学生,你只抽了 100 个同学,想用这 100 位同学的均匀身高代替这 1000 万同学的均匀身高,很显著是不太正当的。那咱们应该起码抽取多少样本才可能代表整体呢?这个起码抽取样本就是最小样本量,示意起码须要这么多样本量,当然也能够比这多,抽样样本越多后果越具备代表性。然而因为事实中尽可能多的样本很难获取,又为了保障抽样后果足够具备代表性,所以咱们个别抉择最小样本量。那这个最小样本量怎么确定呢?就是咱们这一篇重点要讲的内容。
在讲最小样本量之前,咱们先讲一下另一个概念,统计效用,即 power 值。这个在之前的文章中也提过,咱们再提一下。
在假设检验中如果计算出来的 P 值小于等于显著性程度 α,则回绝零假如,否则承受原假如。在这个决策的过程中容易犯两种谬误:第一类谬误 (I 型谬误) 叫做弃真谬误,艰深一点就是漏诊,就是原本是生病了 (假如是正确的),然而你没有检测进去,所以给回绝掉了;第二类谬误(II 型谬误) 是取伪谬误,艰深一点就是误诊,就是原本没病(假如是谬误的),后果你诊断说生病了(假如是正确的),所以就把假如给承受了。
下图中右边的分布图为 H0 对应的散布,左边的分布图为 H1 对应的散布,α 为一型谬误值,β 为二型谬误值。I 型谬误的值个别为 0.05,II 型谬误的值个别为 0.1 或 0.2,而 power = 1 – β,示意 H1 散布下判断正确的把握是多少,即你有多大把握可能正确的回绝掉 H0 假如。
上图中 H1 散布下对应的整体面积减去图中紫色局部的面积就是 power 的大小,具体计算公式如下:
Φ 示意求 z 值对应的累计概率,即正态分布中的面积,Δ 是两组样本均值之差,σ 为各组样本标准差,n 为样本数。
在个别 AB 试验中,咱们假如 AB 两组是同质的,且样本量是统一的,所以有 σ1 = σ2,n1 = n2,将下面的 power 公式进行转换最初能够失去如下对于样本量公式:
须要留神的是不同测验满足的散布是不一样的,对应的 power 公式也是不一样,而最小样本量公式也是从 power 来的,所以不同测验形式对应的最小样本量公式也是不一样的。咱们本篇是以满足正态分布的 Z 测验为例。