二进制状态码

jiezi

6 年前

我们知道计算机中数据都是用二进制数存储。二进制数是一系列 0 和 1 的组合，长整型 64 位，最短的字节型也有 8 位。其中每一位 0 和 1 都可以看做一种状态的开和关，所以就有了这样的一种状态码存储方式：把同一对象的多种状态按位组合到一个整数中。
例如我们最最常见的 *nix 文件权限：

第 9 位
第 8 位
第 7 位
第 6 位
第 5 位
第 4 位
第 3 位
第 2 位
第 1 位
第 0 位

是否目录
所有者读权限
所有者写权限
所有者执行权限
组读权限
组写权限
组执行权限
其余用户读权限
其余用户写权限
其余用户执行权限

0
1
1
1
1
0
1
1
0
1

那么这一组状态在程序中表示为：0b0111101101，即八进制的 0o755，十进制的 493。
二进制状态码存储的主要好处是节省存储空间，相对于键值对（对象）存储而言可读性较差（当然文件权限这种另说）。这种存储方式仅适用于“一个对象有多种状态，每种状态仅有两种情况”这一情形，请不要对一种状态多种情况的情形使用二进制状态码存储方式，更不要出现十进制的 0 1 10 这种状态码，很蠢。。。
使用位运算操作状态码
基于这种存储方式，也衍生了一些操作状态码的方式：
判断第 x 位状态是否开启（x 以 0 开始，下同）：
status & (1 << x) == 0
打开第 x 位
status |= 1 << x
关闭第 x 位
status &= ~(1 << x)
编程语言支持
某些编程语言提供了对二进制状态码的一些原生支持。C/C++ 提供了位域，以及专门的模板库 bitset 用于简化位运算操作。C# 则提供了 Flags 特性标记某个枚举被视作位域
另外很重要一点，JavaScript 虽然也支持位运算，但由于 JavaScript 中的 number 类型都是双精度浮点数，在做位运算时会先将数值截断至 32 位长度。例如很著名的数字转整数 bug：10000000000 | 0 => 1410065408。所以注意如果后端返回二进制状态码让前端判断，确保后端使用 uint32_t 存储
完