读书笔记概率论与数理统计下

jiezi

6 年前

作者：LogM

本文原载于 https://segmentfault.com/u/logm/articles，不允许转载~

文章中的数学公式若无法正确显示，请参见：正确显示数学公式的小技巧

本文为概率论与数理统计的笔记。

11.1 总体，样本
11.2 常用统计量
- 样本均值：$\overline{X} = \frac{1}{n} \sum_{i=1}^{n} X_i$
- 样本方差：$S^2 = \frac{1}{n-1} \sum_{i=1}{n}(X_i – \overline X)^2$
- 样本 $k$ 阶矩：$A_k = \frac{1}{n} \sum_{i=1}^{n} X_i^k$
- 样本 $k$ 阶中心矩：$B_k = \frac{1}{n} \sum_{i=1}^{n} (X_i-\overline X)^k$
11.3 抽样分布
- 正态分布
- $\chi^2$ 分布（卡方分布）
  - 定义：n 个服从标准正态分布 $N(0,1)$ 的随机变量相互独立，则称 $\chi^2 = \sum_{i=1}^{n} X_i^2$ 服从自由度为 $n$ 的 $\chi^2$ 分布，记为 $\chi^2 \sim \chi^2(n)$
  - 概率密度：$f_n(x) = \left \{\begin{matrix} \frac{2}{2\Gamma(n/2)}(\frac{n}{2})^{\frac{n}{2}-1}e^{-\frac{x}{2}} & ,x>0 \\ 0 & ,x \leq 0 \end {matrix} \right.$，其中 $\Gamma(\alpha) = \int_{0}^{+\infty} x^{\alpha-1}e^{-x}dx$
  - 性质：
    - $E(\chi^2) = n$
    - $D(\chi^2) = 2n$
    - 若 $Y_1 \sim \chi^2(n_1)$，$Y_2 \sim \chi^2(n_2)$，且互相独立，则 $Y_1+Y_2 \sim \chi^2(n_1+n_2)$
  - 上 $\alpha$ 分位数：给定 $\alpha$，$0< \alpha <1$，称满足条件 $P(\chi^2>\chi^2_a(n)) = \alpha$ 的点 $\chi^2_a(n)$ 为 $chi^2(n)$ 分布的上 $\alpha$ 分位数
- $t$ 分布
  - 定义：$X \sim N(0,1)$，$Y \sim \chi^2(n)$，相互独立，则称 $T = \frac{X}{\sqrt{Y/n}}$ 服从自由度为 $n$ 的 $t$ 分布，记为 $T \sim t(n)$
  - 上 $\alpha$ 分位数：$t_{1-\alpha}(n) = -t_{\alpha}(n)$
- $F$ 分布
  - 定义：$X \sim \chi^2(n_1)$，$Y \sim \chi^2(n_2)$，相互独立，则称 $F = \frac{X/n_1}{Y/n_2}$ 服从自由度为 $(n_1,n_2)$ 的 $F$ 分布，记为 $F \sim F(n_1,n_2)$
  - 上 $\alpha$ 分位数：$F_{1-\alpha}(n_1,n_2) = \frac{1}{F_{\alpha}(n_1,n_2)}$

12.1 单个正态总体的抽样分布
- 设总体 $X \sim N(\mu, \sigma^2)$，$X_1$，$X_2$，$…$，$X_n$ 是样本，样本均值 $\overline X = \frac{1}{n} \sum_{i=1}^{n}X_i$，样本方差 $S^2 = \frac{1}{n-1} \sum_{i=1}^{n} (X_i-\overline X)^2$，则：
  - $\overline X \sim N(\mu, \frac{\sigma^2}{n})$
  - $\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)$，且 $\overline X$ 与 $S^2$ 相互独立
  - $\frac{\overline X-\mu}{\sigma/\sqrt{n}} \sim N(0,1)$
- 设总体 $X \sim N(\mu, \sigma^2)$，$X_1$，$X_2$，$…$，$X_n$ 是样本，样本均值 $\overline X = \frac{1}{n} \sum_{i=1}^{n}X_i$，样本方差 $S^2 = \frac{1}{n-1} \sum_{i=1}^{n} (X_i-\overline X)^2$，则：
  - $\frac{\overline X – \mu}{S/\sqrt{n}} \sim t(n-1)$
12.2 两个正态总体的抽样分布
- 设样本 $X_1$，$X_2$，$…$，$X_{n_1}$ 和样本 $Y_1$，$Y_2$，$…$，$Y_{n_2}$ 分别来自于总体 $N(\mu_1,\sigma_1^2)$ 和总体 $N(\mu_2,\sigma_2^2)$，并且他们相互独立，样本均值分别为 $\overline X$，$\overline Y$，样本方差分别为 $S_1^2$，$S_2^2$，则：
  - $F=\frac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2} \sim F(n_1-1,n_2-1)$
  - $\frac{(\overline X – \overline Y)-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1}{n_1}+\frac{\sigma_2}{n_2}}} \sim N(0,1)$
  - $\frac{(\overline X – \overline Y)-(\mu_1-\mu_2)}{S_w \sqrt{\frac{\sigma_1}{n_1}+\frac{\sigma_2}{n_2}}} \sim t(n_1+n_2-2)$，其中 $S_w^2 = \frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}$
12.3 矩估计
- 理论依据：大数定律和依概率收敛
- 做法：用原点矩或中心矩来估计参数，比如用样本的期望和方差估计参数

13.1 极大似然估计
- 似然函数（离散型）：$L(\theta) = \Pi_{i=1}^{n} p(x_i;\theta)$
- 似然函数（连续型）：$L(\theta) = \Pi_{i=1}^{n} f(x_i;\theta)$
- 常取 $ln$，再利用倒数为 0 求解
- 性质：若 $\hat{\theta}$ 为 $\theta$ 的极大似然估计，则 $g(\hat{\theta})$ 为 $g(\theta)$ 的极大似然估计
13.2 估计量的评价标准
- 无偏性准则
  - 当估计量的期望 $E(\hat{\theta}) = \theta$，则估计是无偏的，保证估计没有系统偏差
- 有效性准则
  - 估计的方差越小，越有效
- 均方误差准则
  - $Mse(\hat{\theta}) = E(\hat{\theta} – \theta)^2$
  - 当无偏估计时，$Mse({\hat{\theta}}) = D(\hat{\theta})$
  - 均方误差越小越优（比无偏性准则更重要）
- 相合性准则
  - 相合性估计量（一致性估计量）：随着样本 n 的增加，$\hat{\theta}$ 可以依概率收敛到 $\theta$

读书笔记概率论与数理统计下

11. 第十一周

12. 第十二周

13. 第十三周