抽样散布
- 总体:是指钻研对象的整个群体。
- 样本:是从总体中选取的一部分,用于代表总体的整体状况。
- 样本数量:又叫样本空间,是示意有多少个样本。
- 样本大小:及样本的容量,示意每个样本里有多少个数据。
- 抽样散布:将样本平均值可视化,叫做抽样散布。
- 样本均值:一个样本中所有数据的平均值,\(\overline{x}\)。
- 总体均值:要钻研的总体中所有数据的平均值,\(\mu \)。
抽样办法
- 简略随机抽样: 随机选取一个大小为 n 的样本,所有大小为 n 的可能样本被抽取的可能性雷同,包含反复抽样和不反复抽样,具体形式有抽签或应用随机编号生成器。
- 分层抽样:将总体分为几个单位类似的层,层与层之间尽可能不一样,分好层后对每一层进行简略随机抽样。
- 整群抽样:将总体划分为几个群,其中每个群都尽量与其余群类似,可通过简略随机抽样抽取几个群,而后用抽取的群造成样本。
- 系统抽样:选取一个数字 K,而后每到第 K 个数据时就抽样一次。
核心极限定理
在适当的条件下,大量互相独立随机变量的均值经适当标准化后依散布收敛于规范正态分布。这组定理是数理统计学和误差剖析的实践根底,指出了大量随机变量之和近似遵从正态分布的条件。
如何用样本来预计总体
- 均值参数
利用核心极限定理咱们能够用样本预计出总体的平均值,样本均值约等于总体均值。