关于机器学习:编码生成矩阵与检错监督矩阵

本专栏蕴含信息论与编码的外围常识，按知识点组织，可作为教学或学习的参考。markdown版本已归档至【Github仓库：https://github.com/timerring/information-theory 】或者公众号【AIShareLab】回复 信息论 获取。

线性分组码

基本概念

线性分组码数学定义: 编码前信息码元空间 $U^{k}$ , 经映射 $f$ , 编码后码字空间 $C^{n}$ , 即 $f: U^{k} \rightarrow C^{n}$ , 其中 $n>k$ 。若 $f$ 进一步满足线性关系:

$$
f\left(\alpha \mathbf{u} \oplus \beta \mathbf{u}^{\prime}\right)=\alpha f(\mathbf{u}) \oplus \beta f\left(\mathbf{u}^{\prime}\right)
$$

其中 $\alpha, \beta \in G F(2)=\{0,1\}, \mathbf{u} 与 \mathbf{u}^{\prime} \in \mathbf{U}^{k}$ 则称 $f$ 为线性编码映射，进一步若 f 为一一对应映射，则 f 为惟一可译线性编码。由 f 编写成的码 c 称为线性分组码。

线性分组码是一类奇偶校验码，它由（n，k ）模式示意。编码器将一个 k 比特信息分组（信息矢量）转变成一个更长的由给定符号集组成的 n 比特编码分组（编码矢量）。当这个符号集蕴含 2 个元素 (0 and1）时 , 称为二进制编码。

kbit 信息造成 $2^k$ 不同的信息序列 , 称为 k 元组。 nbit 能够造成 $2^n$ 个不同序列，称为 n 元组。（n, k ）分组码输入的长度为 n 的序列称为码字。所有这些码字的汇合称为该线性分组码的码组。

定义: 如果分组码中任意两个码字的线性组合仍是分组码的一个码字，那么该分组码是线性的。对于二进制码，如果 $c_i$ 和 $c_j$是码字，$c_i$+$c_j$也是码字。其中+示意按位模 2 加 (就是逐位相加)。

例:(7,3)线性分组码

$d_{\min }=4$ . $c_{i}+c_{j}$ 仍为码字

疾速计算方法：看除全零码以外，最小的码重就是它的码距。

编码-生成矩阵

编码和生成矩阵

（n，k ）线性分组码的结构——根据给定的 k 个信息码元，设计满足编码条件（最小码距、码率）的 n-k个监督码元。

例: 二元 (7,3) 线性分组码, n=7, k=3, r=7-3=4 ,

$$
\mathbf{u}=\left(u_{2}, u_{1}, u_{0}\right) \rightarrow \mathbf{c}=\left(c_{6}, c_{5}, c_{4}, c_{3}, c_{2}, c_{1}, c_{0}\right)
$$

结构:

编码位高位间接对应信息位;

编码位低位由信息位组合而成。.

$$
\begin{array}{ll}
c_{6}=u_{2} & c_{3}=u_{2} \bigoplus u_{0}=c_{6} \oplus c_{4} \\
c_{5}=u_{1} & c_{2}=u_{2} \bigoplus u_{1} \oplus u_{0}=c_{6} \oplus c_{5} \oplus c_{4} \\
c_{4}=u_{0} & c_{1}=u_{2} \bigoplus u_{1}=c_{6} \oplus c_{5} \\
& c_{0}=u_{1} \oplus u_{0}=c_{5} \oplus c_{4}
\end{array}
$$

写成矩阵模式，为

即 : $\mathbf{C}=\mathbf{u} \mathbf{G}$
设信息码元序列为 $\mathbf{u}$ , 长度为 k , 由 $\mathbf{C}=\mathbf{u G}$ 能够失去一个 n 位的码组, 也即由 k 个信息位通过一个线性变换矩阵 $\mathbf{G}$ 产生。

$\mathbf{G}$- 生成矩阵

$$
\mathbf{G}=\left(\begin{array}{c}
\mathbf{g}_{1} \\
\mathbf{g}_{2} \\
\vdots \\
\mathbf{g}_{k}
\end{array}\right)=\left(\begin{array}{ccc}
g_{11} & \ldots & g_{1 n} \\
\vdots & \vdots & \vdots \\
g_{k 1} & \ldots & g_{k n}
\end{array}\right) k \times n \text { 阶 }
$$

线性分组码的编码: $\mathrm{C}=\mathbf{u G} $

该 (7,3) 码的生成矩阵为

如：若输出的信息为 [011], 由 $\mathrm{C}=\mathrm{uG}$ , 得$\mathrm{C}=[0111010]$, 和码表中的码字统一。

例生成矩阵如图矩阵。
若信息为 $\mu=\left(\begin{array}{lll}1 & 1 & 1\end{array}\right)$ ，则编码出的码字是什么? 1110100

$$
G=\left[\begin{array}{lllllll}
1 & 0 & 0 & 1 & 1 & 1 & 0 \\
0 & 1 & 0 & 0 & 1 & 1 & 1 \\
0 & 0 & 1 & 1 & 1 & 0 & 1
\end{array}\right]
$$

零碎码与非零碎码

若生成矩阵能够分解成两个子块,

$$
\boldsymbol{G}=[\boldsymbol{I} \vdots \boldsymbol{Q}] \text { 或 } \boldsymbol{G}=[\boldsymbol{Q} \vdots \boldsymbol{I}]
$$

其中 $\mathrm{I}$ 为 $\boldsymbol{k}$ 阶单位矩阵, $\mathrm{Q}$ 为 $\boldsymbol{k} *(\boldsymbol{n}-\boldsymbol{k})$ 阶矩阵, 则 C 为零碎码，又称为组织码, G 为零碎码的生成矩阵 (典型生成矩阵)。

若信息分组以不变的模式呈现在线性分组码的任意k位(个别为前k位，或后k位），则称此码组为零碎码，否则称为非零碎码。(如果编码器输入的比特流中原样蕴含了信息比特，叫零碎码。编码输入中的这些原始信息位也叫零碎位。)

生成矩阵的个性

a. 生成矩阵 $\mathbf{G}$ 肯定是 $\boldsymbol{k}$ 行 $\boldsymbol{n}$ 列的 $\boldsymbol{k} \times \boldsymbol{n}$ 阶矩阵, $\mathrm{G}$ 的每行形成一行矢量, 共有 $\boldsymbol{k}$ 个矢量。

b. 线性分组码的每个码字是生成矩阵 $\mathbf{G}$ 各行矢量的线性组合。

$$
\begin{array}{r}
\mathbf{C}=\mathbf{u G}=\left(u_{k-1}, \ldots, u_{1}, u_{0}\right)\left(\begin{array}{c}
\boldsymbol{g}_{1} \\
\boldsymbol{g}_{2} \\
\vdots \\
\boldsymbol{g}_{k}
\end{array}\right) \\
=u_{k-1} \boldsymbol{g}_{1}+u_{k-2} \boldsymbol{g}_{2}+\ldots+u_{1} \boldsymbol{g}_{k-1}+u_{0} \boldsymbol{g}_{k}
\end{array}
$$

c. G的每一行是一个码字。

d. 生成矩阵G的各行线性无关。思考:已知码字汇合，如何结构生成矩阵?

e. 对非零碎码的生成矩阵，总能够通过高等行变换及列替换结构成另一等价的零碎码的生成矩阵并且这两个线性分组码检、纠错性能雷同。

求非零碎 (7,4) 线性分组码的等价零碎码生成矩阵。

$$
\mathrm{G}=\left[\begin{array}{lllllll}
0 & 1 & 0 & 1 & 0 & 1 & 0 \\
0 & 1 & 1 & 1 & 0 & 0 & 1 \\
1 & 1 & 1 & 0 & 0 & 1 & 0 \\
1 & 0 & 1 & 0 & 1 & 0 & 1
\end{array}\right]
$$

列的替换和高等行变换不扭转矩阵的秩，变换后矩阵的各行矢量仍线性无关。

任何一个线性分组 (n, k)码都可等价于一个零碎码。（纠错能力、编码构造)

思考:由非零碎型生成矩阵变换成零碎型生成矩阵，答案惟一吗?

已知某(7，4)分组码的码表如下，请问最小汉明距是多少?请写出该码的典型生成矩阵。

最小汉明距：3

生成矩阵:

$$
G=\left[\begin{array}{lllllll}
1 & 0 & 0 & 0 & 1 & 1 & 1 \\
0 & 1 & 0 & 0 & 1 & 1 & 0 \\
0 & 0 & 1 & 0 & 1 & 0 & 1 \\
0 & 0 & 0 & 1 & 0 & 1 & 1
\end{array}\right]
$$

检错-监督矩阵

由分组码的生成矩阵可失去其监督矩阵。

$$
\mathbf{H C}^{T}=\mathbf{0}^{T},[\mathbf{P}: \mathbf{I}] \mathbf{C}^{T}=\mathbf{0}^{T}
$$

个别状况下, 一个 (n, k) 线性分组码的H矩阵中的（n-k）行对应（n-k）个线性监督方程组, 以确定（n-k）个监督码元。

$\mathbf{H}$——线性分组码的监督矩阵，是$（n-k） \times \mathbf{n}$ 阶的。

若 H=[P ：I], 其中 I 是 ( n-k ）阶方阵, 则 H 为典型监督矩阵。

监督矩阵

$$
H \cdot C^{T}=H \cdot G^{T} \mu^{T}=0^{T}
$$

或者 $\mathbf{G}$ 每一行及其线性组合都是 (n, k) 码的码字, 故 $H \cdot G^{T}=0^{T} \Rightarrow G \cdot H^{T}=0$ .

$$
\begin{array}{c}
G \cdot H^{T}=\left[\begin{array}{ll}
I & Q
\end{array}\left[\begin{array}{c}
P^{T} \\
I
\end{array}\right]=P^{T}+Q=0\right. \\
\therefore Q=P^{T} \text { 或 } P=Q^{T}
\end{array}
$$

请思考：已知 $\mathbf{G}=[I: Q] \Rightarrow \mathbf{H}=[\mathrm{P}: I]$ 若 $G=[Q: I]$ ，则 $H= [I:P]$

监督方程

由

$$
\begin{aligned}
H \cdot C^{T} & =H \cdot G^{T} \mu^{T}=0^{T} \\
& \Rightarrow C H^{T}=0
\end{aligned}
$$

可知，若

$$
\widetilde{\boldsymbol{C}} \boldsymbol{H}^{T} \neq \mathbf{0}
$$

则 $\widetilde{\boldsymbol{C}}$ 不是无效码字, 从而检测出谬误。故：

$$
\boldsymbol{C H}^{T}=0
$$

称为线性分组码的监督方程。

监督矩阵的个性

由H矩阵能够建设线性分组码的线性方程组, H矩阵共有 n-k 行, 其中每行代表一个线性方程的系数, 示意求一个监督位的线性方程;
H矩阵的每行与码集中的一个码字的内积为 0 ;
任何一个 $ (\boldsymbol{n}-\boldsymbol{k})$ 线性分组码的 $\mathrm{H}$ 矩阵有 $ (\boldsymbol{n}-\boldsymbol{k})$ 行, 且每行线性无关;
一个 $(\boldsymbol{n}, \boldsymbol{k}, d)$ 线性分组码, 如要纠正小于等于 t 个谬误, 则其充要条件是H矩阵中任何 2t 列线性无关, 因为最小间隔 d=2t+1 , 所以也相当于要求 H 矩阵中任意 (d-1) 列线性无关。
零碎码的典型生成矩阵 $\mathbf{G}$ 能够不便的失去典型监督矩阵 $\mathbf{H}$ 。

已知一 (6,3) 线性分组码的生成矩阵G如下，求其监督矩阵 $\mathbf{H}$ 。

$$
\begin{array}{l}
\boldsymbol{G}=\left[\begin{array}{llllll}
1 & 0 & 0 & 1 & 1 & 0 \\
0 & 1 & 0 & 1 & 0 & 1 \\
0 & 0 & 1 & 0 & 1 & 1
\end{array}\right] \\
\end{array}
$$

参考文献：

Proakis, John G., et al. Communication systems engineering. Vol. 2. New Jersey: Prentice Hall, 1994.
Proakis, John G., et al. SOLUTIONS MANUAL Communication Systems Engineering. Vol. 2. New Jersey: Prentice Hall, 1994.
周炯槃. 通信原理（第3版）[M]. 北京：北京邮电大学出版社, 2008.
樊昌信, 曹丽娜. 通信原理（第7版） [M]. 北京：国防工业出版社, 2012.

关于机器学习:编码生成矩阵与检错监督矩阵

线性分组码

基本概念

编码-生成矩阵

编码和生成矩阵

零碎码与非零碎码

生成矩阵的个性

检错-监督矩阵

由分组码的生成矩阵可失去其监督矩阵。

监督方程

监督矩阵的个性

评论

发表回复取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

关于机器学习:编码生成矩阵与检错监督矩阵

线性分组码

基本概念

编码-生成矩阵

编码和生成矩阵

零碎码与非零碎码

生成矩阵的个性

检错-监督矩阵

由分组码的生成矩阵可失去其监督矩阵。

监督方程

监督矩阵的个性

评论

发表回复 取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

发表回复取消回复