乐趣区

二进制状态码

我们知道计算机中数据都是用二进制数存储。二进制数是一系列 0 和 1 的组合,长整型 64 位,最短的字节型也有 8 位。其中每一位 0 和 1 都可以看做一种状态的开和关,所以就有了这样的一种状态码存储方式:把同一对象的多种状态按位组合到一个整数中。
例如我们最最常见的 *nix 文件权限:

第 9 位
第 8 位
第 7 位
第 6 位
第 5 位
第 4 位
第 3 位
第 2 位
第 1 位
第 0 位

是否目录
所有者读权限
所有者写权限
所有者执行权限
组读权限
组写权限
组执行权限
其余用户读权限
其余用户写权限
其余用户执行权限

0
1
1
1
1
0
1
1
0
1

那么这一组状态在程序中表示为:0b0111101101,即八进制的 0o755,十进制的 493。
二进制状态码存储的主要好处是节省存储空间,相对于键值对(对象)存储而言可读性较差(当然文件权限这种另说)。这种存储方式仅适用于“一个对象有多种状态,每种状态仅有两种情况”这一情形,请不要对一种状态多种情况的情形使用二进制状态码存储方式,更不要出现十进制的 0 1 10 这种状态码,很蠢。。。
使用位运算操作状态码
基于这种存储方式,也衍生了一些操作状态码的方式:
判断第 x 位状态是否开启(x 以 0 开始,下同):
status & (1 << x) == 0
打开第 x 位
status |= 1 << x
关闭第 x 位
status &= ~(1 << x)
编程语言支持
某些编程语言提供了对二进制状态码的一些原生支持。C/C++ 提供了 位域,以及专门的模板库 bitset 用于简化位运算操作。C# 则提供了 Flags 特性标记某个枚举被视作位域
另外很重要一点,JavaScript 虽然也支持位运算,但由于 JavaScript 中的 number 类型都是双精度浮点数,在做位运算时会先将数值截断至 32 位长度。例如很著名的数字转整数 bug:10000000000 | 0 => 1410065408。所以注意如果后端返回二进制状态码让前端判断,确保后端使用 uint32_t 存储

退出移动版