咱们在后面的方差分析中有提过一个概念就是自由度,在后面文章中给了一个计算就是自由度 = 样本数 -1。这一篇就来具体聊聊什么是自由度。
先来看看百度百科的解释:
自由度 (degree of freedom, df) 指的是计算某一统计量时,取值不受限制的变量个数。通常 df=n-k。其中 n 为样本数量,k 为被限度的条件数或变量个数。
下面加粗的局部其实就是对于自由度的外围解释了。再给大家举个例子:
假如当初有三个变量 x1、x2、x3,且这三个变量之间没有任何分割,那么这三个变量的取值都是独立的、不受限制的、互不烦扰的。这个时候自由度就是 3,因为有 3 个变量的取值不受限制。
如果咱们给下面这三个变量加一个限度条件,就是 x1+x2+x3=0,这个时候这三个变量的取值就不能轻易了,前两个变量的取值能够轻易点,然而第三个变量的取值就受前两个变量取值的限度,所以此时的取值不受限制的变量个数变成了 2,也就对应的自由度变成了 2。
了解了自由度的外围原理当前咱们来看看自由度的次要利用场景:
1. 方差
第一个场景就是总体方差和样本方差,咱们晓得总体方差的分母是 n,而样本方差的分母是 n -1,这是因为在计算样本方差时须要用到样本均值,如果样本均值已知了,那么组成样本的 n 个样本中就会有一个样本的取值受到限制。此时的自由度就变成了 n -1。
再想一下方差的概念,方差其实看的是 n 个样本的均匀稳定水平,也就是由这 n 个样本一起导致的稳定有多大。而样本方差中理论可能决定稳定的只有 n - 1 个样本,所以就除 n -1。
2. 回归
在回归方程中也波及到自由度的问题,假如当初有 n 个 x 变量,因为这 n 个 x 形成了一个方程,这个方程就是一个约束条件,此时能够自在变换的变量就是 n - 1 个,对应的自由度也就是 n -1。
以上就是对于自由度的一个简略介绍,大家好好了解了解。