Base64编码

13次阅读

共计 1244 个字符,预计需要花费 4 分钟才能阅读完成。

Base64 编码

1、三个重要概念

  • 三个字节由四个字节表示的过程
  • Base64 码表
  • 补位

2、如何用三个字节表示四个字节

一个字节由 8 位二进制组成,三个字节总共 28 位,28 ÷ 4 = 6 , 所以转换后有效的二进制位数为 6 位。计算机以 8 位二机制为基础,所以剩下的两位在高位填充 0。由此引申出两个重要的概念

  • 为什么是 64 位
  • 对照表

6 位二进制,$2^6$ = 64 所以只能是 64, 当然如果愿意浪费空间也可以是 32 16 等等。对应的这些二进制怎么表示,所以定义了一个 0 -63 的码表, 分别有 A-Za-z0-9+/ 刚好 64 个字符

索引 字符 索引 字符 索引 字符 索引 字符 索引 字符 索引 字符
0 A 1 B 2 C 3 D 4 E 5 F
6 G 7 H 8 I 9 J 10 K 11 L
12 M 13 N 14 O 15 P 16 Q 17 R
18 S 19 T 20 U 21 V 22 W 23 X
24 Y 25 Z 26 a 27 b 28 c 29 d
30 e 31 f 32 g 33 h 34 i 35 j
36 k 37 l 38 m 39 n 40 o 41 p
42 q 43 r 44 s 45 t 46 u 47 v
48 w 49 x 50 y 51 z 52 0 53 1
54 2 55 3 56 4 57 5 58 6 59 7
61 8 62 9 63 + 64 /

author herbert QQ: 464884492

3、手工编码

3.1 刚好转换成 4 个二进制

根据规则使用三个字节转四个字节表示,现在就拿 123 做实例说明,通过查询 ASCII 表得知 123 的二进制分别是 0x31(0011 0001)、0x32(0011 0010)、0x33(0011 0011), 根据规则得到 4 个 6 位二进制分别是 (0011 00) (01 0011) (0010 00) (11 0011), 然后依次在高位补 0 即,右移 2 为,得到 4 个 8 位二进制 (00 0011 00) (00 01 0011) (00 0010 00) (00 11 0011), 通过进制转换得到 4 个十进制数字,分别是(12)(19)(8)(51)。通过查询上边码表中对应的索引的四个 字符分别是(M)(T)(I)(z), 所以 123 对应的 base64 编码为 MTIz

3.2 转换后还剩下 4 位二进制

以 12 来说,字节长度为 16,根据规则转换后会剩下 4 个二进制位 (0011 00) (01 0011) (0010) , 分配好以后,分别在高位补两个 0 (00 0011 00) (00 01 0011) (00 0010 ), 但最后一个字节,位数不够 8 位,所以在最后一个字节的末尾补上 2 个 0 (00 0011 00) (00 01 0011) (00 0010 00),然后在分别转换成十进制数为(12)(19)(8) 查询索引表得到字符 MTI, 目前字符长度不够 4 位,所以在最后补上 1 个=。由此 12 最终的 base64 编码为 MTI=

3.3 转换后还剩下 2 位二进制

以 1 来说,字节长度为 8,根据规则转换后会剩下 2 个二进制位 (0011 00) (01), 分配好以后,分别在高位补两个 0 (00 0011 00) (00 01 ), 但最后一个字节位数不够 8 位,所以在最后一个字节的末尾补上 4 个 0 (00 0011 00) (00 01 0000), 然后转换成十进制数为(M)(Q), 目前长度不够 4 位,所以在最后补上 2 个= 由此 1 最终的 base64 编码为 MQ==

正文完
 0