高日耀资深数据库内核研发

毕业于华中科技大学，喜爱钻研支流数据库架构和源码，并长期从事分布式数据库内核研发。曾参加分布式 MPP 数据库 CirroData 内核开发（西方国信），现次要负责 MySQL 系列产品内核开发（青云科技）。

笔者曾做过数据库 Data Type 相干的设计和从 0 到 1 的源码实现，对 Numeric（与 Decimal 等价，都是规范 SQL 的一部分）, Datetime, Timestamp, varchar … 等数据类型的设计、源码实现及在内存中计算原理有比拟深的了解。

本篇基于 PostgreSQL 源码，解析 PostgreSQL 中 Numeric 类型的内存计算构造和磁盘存储构造。

c 源码：https://github.com/postgres/p…

头文件：https://github.com/postgres/p…

| 精度的要求

在编程的过程中，大家可能对内置的 4 字节 float 和 8 字节 doulbe 类型比拟相熟，进行加减乘除运算。尽管浮点数是通过迷信计数法来存储，但在二进制和十进制相互转换机制中，对一部分二进制数，其精度是有缺失的。

对于相似金融场景，动辄存储微小的数值，以及对数据精度的高要求，哪怕再小的精度损失都是不可承受的。市面上各式各样的数据库根本都蕴含 Numeric 类型，通过字符串来准确存储每一位数，做到浮点数都做不到的准确计算。

| Numeric 语法简介

NUMERIC(precision, scale)

precision：numeric 中全副数字个数的总和
scale：小数点前面的数字个数

例如：12.345，那么 precision 是 5、scale 是 3。

注意事项：

所有的整数都能够看成 scale 为 0 的 numeric；
precision 必须为负数，scale 能够为 0 或者负数；
numeric(precision) 语法，默认的 scale 是 0；
语法中不带任何参数，则任意 precision 和 scale 的值都能够被存储，只有不超过 precision 的最大值；
只有 numeric 中申明了 scale，则输出的值都要强制的去匹配这个 scale（即进行 round 操作，round 为四舍五入）；
如果输出的 scale 数值溢出，则报错。

不指定精度的状况时各数值类型的取值范畴【常见】：

| Numeric 非凡值

除了失常的数值之外，numeric 还反对非凡的值：NaN（ meaning “not-a-number”）。当要将其当做常量用于 SQL 中时，须要打上引号，例如：

UPDATE table SET x = 'NaN'

| SQL 中 Numeric 数据流向

咱们晓得，一条 SQL 在数据库中的执行流程大抵为：

CREATE TABLE test (
    name VARCHAR(100) NOT NULL,
    price NUMERIC(5,2)
);

INSERT INTO test (name, price)
VALUES ('Phone',500.215), 
       ('Tablet',500.214);

以上述示例两条 SQL 为例，先建一张 test 表，并插入数据。这里咱们关注写入的 Numeric 数字在内存中是如何示意，定义的 NUMERIC(5,2) 对应的数据结构在内存中如何示意。写入的数据在落入磁盘之后，其存储构造又是什么样的。

这里，数据在内存中的存储构造和落盘时的存储构造是不一样的，最终落盘时须要去掉内存中所占用的有效字节的。比方，varchar(100)，如果在内存中调配 100 个字节，而理论只写入 “abc” 三个字节，那么它所调配的内存是 100 个字节，而落盘时没有用到的 97 个字节是要去掉的，最初3个字节写入磁盘时，还要做数据压缩。大家能够构想一下，如果内存中的存储构造不做任何解决间接写入到磁盘，如果数据量十分大，那会多节约磁盘空间！

| Numeric 磁盘存储构造解析

构造体 NumericData 是最终落到磁盘上的构造，如下，能够看到 NumericData 蕴含了 NumericLong 和 NumericShort 的 union 字段：

struct NumericLong
{
        uint16          n_sign_dscale;  /* Sign + display scale */
        int16           n_weight;               /* Weight of 1st digit  */
        NumericDigit n_data[FLEXIBLE_ARRAY_MEMBER]; /* Digits */
};

struct NumericShort
{
        uint16          n_header;               /* Sign + display scale + weight */
        NumericDigit n_data[FLEXIBLE_ARRAY_MEMBER]; /* Digits */
};

union NumericChoice
{
        uint16          n_header;               /* Header word */
        struct NumericLong n_long;      /* Long form (4-byte header) */
        struct NumericShort n_short;    /* Short form (2-byte header) */
};

struct NumericData
{
        int32           vl_len_;                /* varlena header (do not touch directly!) */
        union NumericChoice choice; /* choice of format */
};

构造体 NumericLong

struct NumericLong
{
        uint16          n_sign_dscale;  /* Sign + display scale */
        int16           n_weight;               /* Weight of 1st digit  */
        NumericDigit n_data[FLEXIBLE_ARRAY_MEMBER]; /* Digits */
};

uint16 n_sign_dscale：第一个字节中高两位 bit 用于保留正负号。

若为 0x0000：则符号位正

若为 0x4000：则符号位负

若为 0xC000：则为 NaN

残余的 14 个 bit 用来保留 display scale（终端界面可显示的范畴）

int16 n_weight ：保留权值。这里要解释下权值在这里的含意。在这里 numeric 是用一组 int16 数组示意的，每一个元素用 int16 示意4位数字，也就是最大保留9999。那么基数 base 值就是 10000。这里的权值的 base 值就是 10000（10 进制的权值 base 值是 10，二进制是 2）。

NumericDigit n_data[FLEXIBLE_ARRAY_MEMBER] ：动静数组（也有叫柔性数组的，在这里对立称动静数组吧），是 C99 之后增加的一个个性。这个个性是在这个构造体中，动静数组并不占用任何空间，其长度由 NumericData 中的 vl_len_ 决定。

这里看到有 long 和 short 两个构造体，对于晚期的 PostgreSQL 版本，应用的是 long 的存储形式，前面进行了优化，改良成 short 的存储形式，改良之后的版本为了放弃向前兼容，能仍然读取之前版本存储的数据，保留了 long 类型的存储形式。

构造体 NumericShort

struct NumericShort
{
        uint16          n_header;               /* Sign + display scale + weight */
        NumericDigit n_data[FLEXIBLE_ARRAY_MEMBER]; /* Digits */
};

uint16 n_header ：保留符号、dynamic scale和权值的信息。

若为 0xC000 则意味着该 Numeric 为 NaN

残余的 14 个 bit 中，1 个用来保留符号，6 个保留 dynamic scale，7个用来保留权值 weight。

NumericDigit n_data[FLEXIBLE_ARRAY_MEMBER] ：参考上文柔性数组形容。

联合体 NumericChoice

union NumericChoice
{
        uint16          n_header;               /* Header word */
        struct NumericLong n_long;      /* Long form (4-byte header) */
        struct NumericShort n_short;    /* Short form (2-byte header) */
};

uint16 n_header ：这个占两个字节的变量蕴含有很多信息。如果 n_header 第一个字节最高两个 bit 位的值为：

0x8000：则采纳 NumericShort 存储格局

0xC000：则为 NaN

除此之外，则采纳 NumericLong 存储格局。

构造体 NumericData

struct NumericData
{
        int32           vl_len_;                /* varlena header (do not touch directly!) */
        union NumericChoice choice; /* choice of format */
};

int32 vl_len_ ：用来保留动静数组的长度，这个数组是 NumericLong 或者 NumericShort 构造体中定义的动静数组。

| Numeric 内存计算构造解析

typedef struct NumericVar
{
        int                     ndigits;                /* # of digits in digits[] - can be 0! */
        int                     weight;                 /* weight of first digit */
        int                     sign;                   /* NUMERIC_POS, NUMERIC_NEG, or NUMERIC_NAN */
        int                     dscale;                 /* display scale */
        NumericDigit *buf;                      /* start of palloc'd space for digits[] */
        NumericDigit *digits;           /* base-NBASE digits */
} NumericVar;

NumericVar 是用来做算术运算的格局，在 digit-array 局部同存储格局一样，然而在 header 局部更简单。上面别离作剖析：

buf：指向理论为 NumericVar 申请的内存 start 地位
digits：指向理论应用时的第一个数字的地位（这里的元素是 int16，非 0）
- buf 跟 digts 之间个别预留一到两个元素（int16）作为可能的 carry （进位）用，当然，思考到理论 numeric 中 leading 局部可能有好多 0，意味着 buf 跟 digits 之间能够相隔好多个元素
dscale：display scale 的缩写，示意 numeric 小数点后有多少个十进制数
- 就目前的版本，总是 >=0，dscale 的值可能比理论存储的小数位数要大，这象征多进去的局部是 0（trailing zeros），同时也意味着在写入磁盘时，是不会把无意义的 0 写进去的（节约磁盘空间）
rscale：这里提一个在函数计算时用到的变量，result scale 的缩写，保留指标计算结果的精度，总是 >=0
- rscale 并不保留在 NumericVar 中，理论值是依据输出的 dscales 确定的
sign：标记正负号或者 NAN
weight：权值，权值是进制的（位数 -1）幂
- 比方 9999 9999 9999.9999，占用三个 int16，权值是 2（原理跟 10 进制权值一样的算法，只是 int16 的基数值是 10000）
ndigits：在 digits[ ] 数组中的 int16 的个数

| 下期预报

以上对 PostgreSQL 中 Numeric 类型的磁盘存储构造和内存计算构造做了初步解析。

下一篇将基于本篇的内存计算构造，进一步分析 Numeric 加减乘等数学运算在代码中的实现原理，通过数学公式分析二进制、十进制互相转化之后为何只会有限迫近，不会相等，会带来精度损失的问题。后续持续解析 MySQL / Oracle 中 Numeric 类型的设计和源码实现。

关于数据库:源码-为金融场景而生的数据类型Numeric

| 精度的要求

| Numeric 语法简介

| Numeric 非凡值

| SQL 中 Numeric 数据流向

| Numeric 磁盘存储构造解析

构造体 NumericLong

构造体 NumericShort

联合体 NumericChoice

构造体 NumericData

| Numeric 内存计算构造解析

| 下期预报

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于数据库:源码-为金融场景而生的数据类型Numeric

| 精度的要求

| Numeric 语法简介

| Numeric 非凡值

| SQL 中 Numeric 数据流向

| Numeric 磁盘存储构造解析

构造体 NumericLong

构造体 NumericShort

联合体 NumericChoice

构造体 NumericData

| Numeric 内存计算构造解析

| 下期预报

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复