1. 需要

当初有个需要，须要对立段时间内登陆的用户数量。这一段时间里可能先后登陆了用户a、b、c、b、c、a、d这么多人，可能有人反复登陆，咱们在解决时就须要去重而后返回用户数量。

下面的状况就是基数统计：获取一个汇合S去重之后的汇合大小。

一种办法就是应用hashmap，hashmap的key是用户名，value是它登陆的次数。在64位机器中，golang在一条记录上应用24个字节。当用户成千上万乃至上亿的时候，须要的内存空间就十分大了。

为了节俭内存空间，还有其余办法：$B^+$树、Bitmap等，Redis中应用HyperLogLog来进行粗略的统计，12k内存能够统计$2^{64}$个数据。

2. 伯努利试验

HyperLogLog的原理和伯努利试验无关。

投掷硬币，侧面和背面呈现的概率都是50%。那始终投掷硬币直到第t次投掷呈现侧面，这个过程就是一次伯努利试验。

如果进行n次伯努利试验，第1次试验，n=1，对应的投掷次数为$t_1$；第n次试验，对应的投掷次数为$t_n$。

进行完这么屡次试验之后，必定有一个最大的投掷次数$t_{max}$

n次伯努利试验的投掷次数都不大于 $t_{max}$
n次伯努利试验中，至多有一次投掷次数等于 $ t_{max}$

n和$ t_{max}$存在如下估算关系：

$$
n=2^{t_{max}}
$$

具体的推导我就不说了，概率论的相干内容。

通过屡次伯努利试验的 $ t_{max}$能够推导失去进行的伯努利试验的次数n。那么如果把HyperLogLog的一次ADD当做一次伯努利试验，那么通过计算每次伯努利试验的最大投掷次数$ t_{max}$应该就能够求出HyperLogLog统计的元素数量n了。这就是HyperLogLog的基本原理。

HyperLogLog的第i次ADD的投掷次数$t_i$怎么计算呢？每次ADD的元素的hash值是一系列0和1组合的字节码，那么就能够通过统计从某个地位、某个方向开始第一个1所在的地位来计算$ t_i$。例如，0b1010 1000，从最低位向最高位计算失去$t=4$。

3. HyperLogLog

HyperLogLog基于LogLogCounting等算法，它应用一个简直平均的hash函数获取须要统计的元素的hash值，而后通过分桶均匀打消误差。HLL(之后均代表HyperLogLog)把hash值分成一个一个的桶，并且用hash值的前k个位来寻找它的桶地位，桶的数量示意成：

$$
m=2^k
$$

如下图，LSB示意最低位，MSB示意最高位，这个hash值示意为大端字节序。k=6，阐明一共有64个桶。而下图的hash值示意的桶地位是0b00 1101=13。

接下来计算上图hash值中后L-k的序列中第一个1呈现的地位：6。因而在索引号为13的桶中进行后续操作，如果桶中的数字比6小就设置为6，否则就不变。

统计每个桶中贮存的值的平均数，就能够计算失去估算的基数值。

HLL中应用和谐平均数进行计算：

$$
H=\frac{n}{\frac{1}{x_1}+\frac{1}{x_2}+…+\frac{1}{x_n}}=\frac{n}{\sum_{i=1}^n\frac{1}{x_i}}
$$

它的基数估算公式就是：

$$
\hat{n}=\frac{\alpha_mm^2}{\sum_{i=0}^m2^{-M[i]}}
$$

其中，M[i]示意第i个桶中的数值，示意为该hash值下第一个1对应的最大地位。

还有：

$$
\alpha_m=(m\int_0^\infty(log_2(\frac{2+u}{1+u}))^mdu)^{-1}
$$

HLL的执行步骤能够通过这个HLL模仿网站进行理解，建设大抵的印象为后续的内容铺垫。

http://content.research.neust…

能够看出，HLL占用很少的内存来实现十分大的基数统计，相应的实现也必然很简单，下一节就是剖析其在redis中的实现。

4. redis HLL实现

4.1. HLL介绍

redis HLL代码：

https://github.com/crazyStrom…

redis应用register（寄存器）来示意hash定位的桶，其中的内容就是统计的hash值的L-k那一部分中第一个1的最大地位。上面是redis代码中的HLL介绍。

redis应用[1]中提出的64位hash函数，通过在每个寄存器或桶中减少1bit，将基数统计的下限进步到$10^9$以上。

[1] Heule, Nunkesser, Hall: HyperLogLog in Practice: Algorithmic Engineering of a State of The Art Cardinality Estimation Algorithm.*

redis应用它的sds来贮存HLL，并不创立新的数据类型。

redis不对[1]中的数据结构进行额定的压缩。redis应用[2]中的HyperLogLog的算法，惟一不同的是redis应用64位hash函数。

[2] P. Flajolet, Éric Fusy, O. Gandouet, and F. Meunier. Hyperloglog: The analysis of a near-optimal cardinality estimation algorithm.*

redis在HLL中应用两种不同的数据贮存模式：

dense模式。HLL的每个entry（每个寄存器中的内容）应用一个6位的数字示意。
sparse模式。当HLL中有很多寄存器为0时对这些寄存器进行压缩，以进步内存利用率。

4.1.1. HLL header

redis应用hllhdr来持有一个HLL：

struct hllhdr {
    char magic[4];      /* "HYLL" */
    // 编码格局：sparse或者dense
    uint8_t encoding;   /* HLL_DENSE or HLL_SPARSE. */
    uint8_t notused[3]; /* Reserved for future use, must be zero. */
    // 缓存的基数统计值
    uint8_t card[8];    /* Cached cardinality, little endian. */
    // 理论的寄存器们，dense有16384个6bit寄存器
    uint8_t registers[]; /* Data bytes. */
};

dense和sparse模式都应用16字节的header。

前四个字节是HYLL，固定不变。
encoding占用一个字节，示意HLL的编码模式：HLL_DENSE和HLL_SPARSE。
notused占用三个字节，进行占位用的。
card占用八个字节，用小端字节序贮存的64位整数，保留最近的基数计算结果。如果从上一次基数计算到当初，数据结构都没有批改过，card中的内容能够从新应用。redis应用card最高位示意该数据是否可用，如果最高位是1，表明数据被批改了，就须要从新计算基数并缓存到card中。

registers示意这个HLL所持有的dense或sparse模式的数据。

4.1.2. dense模式

HLL的dense编码模式应用的寄存器都是6bit，并且是间断排列。一个字节是8bit，因而一个字节会同时持有两个寄存器的局部或全副bit。

dense模式的寄存器都是从LSB到MSB进行编码，即从最低位到最高位。如果以后字节不够贮存寄存器的残余bit，就会依据须要应用下一个字节。

上图中，从左到右有三个字节，蕴含了四个寄存器0-3。第0个字节的后六位贮存的是0号寄存器的内容，第0个字节的前两位和第1个字节的后四位贮存的是1号寄存器的内容，以此类推，这就是dense的贮存模式。

4.1.3. sparse模式

HLL应用三种操作码实现对其数据结构的sparse编码。这三个操作码别离是ZERO、XZERO和VAL，其中两个操作码别离应用一个字节，另一个操作码应用两个字节。

上面介绍这三种操作码。

ZERO操作码占用一个字节，示意为00xxxxxx，后六位xxxxxx+1示意有N个间断的寄存器设置为0，这个操作码能够示意1-64个间断的寄存器被设置为0。
XZERO操作码占用两个字节，示意为01xxxxxx yyyyyyyy。xxxxxx是高位，yyyyyyyy是低位。这十四位+1示意有N个间断的寄存器设置为0.这个操作码能够示意0-16384个寄存器被设置为0。
VAL操作码占用一个字节，示意为1vvvvvxx。它蕴含一个5bit的vvvvv示意寄存器值，2bit的xx+1示意有这么多个间断的寄存器被设置为vvvvv。这个操作码示意能够示意1-4个寄存器被设置1-32的值。

sparse无奈示意寄存器值超过32的寄存器，然而在HLL中超过32的寄存器值很少见。当没有这种状况时，sparse要比dense具备更高的内存效率，而如果有寄存器值超过32时，HLL会从sparse转换为dense。

sparse用来示意某个地位的寄存器内容，它是地位性的。例如，一个空HLL示意成01111111 11111111，这阐明有16384个寄存器被设置为0，记作XZERO:16384。

再例如，一个HLL只有三个寄存器值不是0，地位别离是1000，1020，1021，值别离是2，3，3，这个HLL的sparse示意为：

XZERO:1000 0-999号寄存器设置为0

VAL:2,1 1个寄存器设置为2，即1000号寄存器

ZERO:19 1001-1019号寄存器为0

VAL:3,2 两个寄存器设置为3，别离是1020、1021号寄存器

XZERO:15362 从1022-16383号寄存器设置为0

当基数比拟小的时候，HLL有很高的的利用率。下面的例子中应用了7个字节示意所有的HLL寄存器，而dense应用12k的内存。

然而，sparse在进行2000-3000的基数计算时效率高，然而基数更大时，sparse转换成dense效率更高。通过定义server.hll_sparse_max_bytes实现sparse切换为dense时sparse的最大长度。

4.2. redis HLL 实现代码

hllhdr定义：

struct hllhdr {
    char magic[4];      /* "HYLL" */
    // 编码格局：sparse或者dense
    uint8_t encoding;   /* HLL_DENSE or HLL_SPARSE. */
    uint8_t notused[3]; /* Reserved for future use, must be zero. */
    // 缓存的基数统计值
    uint8_t card[8];    /* Cached cardinality, little endian. */
    // 理论的寄存器们
    uint8_t registers[]; /* Data bytes. */
};

4.2.1. 相干定义和宏

redis运行很快的起因就是应用了大量的宏定义。

后面说到，redis应用card作为缓存进步HLL的效率。而card是否可用通过其最高位来判断的，当最高位设置为1时，阐明HLL被批改了，card的缓存不可用，须要从新计算。

/* The cached cardinality MSB is used to signal validity of the cached value. */
// card的第八位设置为1示意缓存不可用
#define HLL_INVALIDATE_CACHE(hdr) (hdr)->card[7] |= (1<<7)
#define HLL_VALID_CACHE(hdr) (((hdr)->card[7] & (1<<7)) == 0)

残余的就是一些罕用定义和宏。

#define HLL_P 14 /* The greater is P, the smaller the error. */
// HLL应用16384个寄存器：0b 0100 0000 0000 0000
#define HLL_REGISTERS (1<<HLL_P) /* With P=14, 16384 registers. */
// HLL的掩码用来找地位，0x0011 1111 1111 1111
#define HLL_P_MASK (HLL_REGISTERS-1) /* Mask to index register. */
#define HLL_BITS 6 /* Enough to count up to 63 leading zeroes. */
#define HLL_REGISTER_MAX ((1<<HLL_BITS)-1)
#define HLL_HDR_SIZE sizeof(struct hllhdr)
#define HLL_DENSE_SIZE (HLL_HDR_SIZE+((HLL_REGISTERS*HLL_BITS+7)/8))
#define HLL_DENSE 0 /* Dense encoding. */
#define HLL_SPARSE 1 /* Sparse encoding. */
#define HLL_RAW 255 /* Only used internally, never exposed. */
#define HLL_MAX_ENCODING 1

4.2.2. 位运算的宏

redis应用一系列的宏简化HLL的dense和sparse模式的相干位运算。

4.2.2.1. dense运算

HLL应用8bit的字节数组registers来贮存dense的6bit寄存器组。因而须要把8bit数组分成6bit数组并进行取值和设置值的操作。redis应用宏来保障运行速度。

上图示意的是大端字节序，最高位(MSB)在右边。redis从最低位向最高位顺次遍历。

(1) 取寄存器值

例如，获取在地位pos=1处的寄存器值，寄存器编号从0开始。

保留1号寄存器局部内容的第一个字节是b0：1100 0000。

b0 = 6 * pos / 8

1号寄存器的第一位是这么计算的：

fb = 6 * pos % 8 -> 6

把b0右移fb位：1100 0000 >> fb = 0000 0011

把b1左移8-fb位：2222 1111 << (8-fb) = 2211 1100

将这两个字节进行OR操作：0000 0011 | 2211 1100 = 2211 1111

而后将后果和0011 1111进行AND操作以打消高2位：2211 1111 & 0011 1111 = 0011 1111，这就是1号寄存器的值。

另一个例子，获取0号寄存器的内容。这个状况下，这个寄存器的六位都在一个字节b0中：1100 0000。

b0 = 6 * pos / 8 = 0

0号寄存器的第一位的地位：

fb = 6 * pos % 8 = 0

因而将以后字节b0右移0位：1100 0000 >> 0 = 1100 0000

下一字节b1左移8位：2222 1111 << 8 = 0000 0000

挪动后的两个字节进行OR操作：1100 0000 | 0000 0000 = 1100 0000

而后将后果和0011 1111进行AND操作打消高2位：1100 0000 & 0011 1111 = 0000 0000

因而寄存器0的内容就是00 0000

(2) 设置寄存器值

设置寄存器的值就比较复杂了，假如val=0b 00cd efgh是须要设置的新值。须要两步，第一步革除寄存器的相干位，第二部通过或操作设置新的位。

例如，设置1号寄存器的值，它的第一个字节是b0。

这个例子中，fb=6。

为了生成一个AND掩码来革除b0的相干位，学生成一个值为63的初始掩码0b0011 1111。左移fb位，而后取反码：!(0011 1111 << fb) = 0011 1111。

让新掩码和b0进行AND操作以革除寄存器1的相干位：0011 1111 & 1100 0000 = 0000 0000

把val左移fb位，和上述后果进行OR操作就设置了b0的新值：b0 = (val << fb) OR b0 = (00cd efgh << 6) OR 0000 0000 = gh00 0000

接下来就是设置b1的相干位。b1的初始值为2222 1111。

应用63构建AND掩码，右移8-fb位，而后翻转：!(0011 1111 >> (8-fb)) = 1111 0000。

将新掩码和b1进行AND操作以革除相干位：b1 = 1111 0000 & 2222 1111 = 2222 0000

而后将val = 0b 00cd efgh右移8-fb位，而后和b1进行OR操作以设置相干位：b1 = (00cd efgh >> (8-fb)) | b1 = 2222 cdef

(3) redis实现代码

redis的实现代码就很简略，有点C根底的都能看懂。

/* Store the value of the register at position 'regnum' into variable 'target'.
 * 'p' is an array of unsigned bytes. */
#define HLL_DENSE_GET_REGISTER(target,p,regnum) do { \
    uint8_t *_p = (uint8_t*) p; \
    // 这个寄存器在第_byte个字节
    unsigned long _byte = regnum*HLL_BITS/8; \
    // 这个寄存器在第_byte个字节的第_fb位
    unsigned long _fb = regnum*HLL_BITS&7; \
    unsigned long _fb8 = 8 - _fb; \
    unsigned long b0 = _p[_byte]; \
    unsigned long b1 = _p[_byte+1]; \
    // b0的高fb位、b1的低fb8位
    target = ((b0 >> _fb) | (b1 << _fb8)) & HLL_REGISTER_MAX; \
} while(0)

/* Set the value of the register at position 'regnum' to 'val'.
 * 'p' is an array of unsigned bytes. */
#define HLL_DENSE_SET_REGISTER(p,regnum,val) do { \
    uint8_t *_p = (uint8_t*) p; \
    unsigned long _byte = regnum*HLL_BITS/8; \
    unsigned long _fb = regnum*HLL_BITS&7; \
    unsigned long _fb8 = 8 - _fb; \
    unsigned long _v = val; \
    _p[_byte] &= ~(HLL_REGISTER_MAX << _fb); \
    _p[_byte] |= _v << _fb; \
    _p[_byte+1] &= ~(HLL_REGISTER_MAX >> _fb8); \
    _p[_byte+1] |= _v >> _fb8; \
} while(0)

4.2.2.2. sparse运算

sparse模式就不须要查找对应的位了，然而须要辨别它的操作码类型、操作码笼罩的寄存器范畴、以及相应的操作码设置。

ZERO示意为00xx xxx，XZERO示意为01xx xxxx xxxx xxxx，VAL示意为1vvv vvxx。因而通过每个字节的前两位能够判断对应的操作码。

#define HLL_SPARSE_XZERO_BIT 0x40 /* 01xxxxxx */
#define HLL_SPARSE_VAL_BIT 0x80 /* 1vvvvvxx */
#define HLL_SPARSE_IS_ZERO(p) (((*(p)) & 0xc0) == 0) /* 00xxxxxx */
#define HLL_SPARSE_IS_XZERO(p) (((*(p)) & 0xc0) == HLL_SPARSE_XZERO_BIT)
#define HLL_SPARSE_IS_VAL(p) ((*(p)) & HLL_SPARSE_VAL_BIT)

ZERO的后六位示意寄存器的长度，XZERO的后14位示意间断寄存器的长度，VAL的后两位是寄存器的长度，vvvvv是寄存器值，通过这些特色能够取得这三种操作码的相干信息。

#define HLL_SPARSE_ZERO_LEN(p) (((*(p)) & 0x3f)+1)
#define HLL_SPARSE_XZERO_LEN(p) (((((*(p)) & 0x3f) << 8) | (*((p)+1)))+1)
#define HLL_SPARSE_VAL_VALUE(p) ((((*(p)) >> 2) & 0x1f)+1)
#define HLL_SPARSE_VAL_LEN(p) (((*(p)) & 0x3)+1)

VAL的操作码后两位是寄存器长度，两头5位vvvvv是寄存器值，因而设置VAL操作码的val和长度len的代码如下：

#define HLL_SPARSE_VAL_SET(p,val,len) do { \
    *(p) = (((val)-1)<<2|((len)-1))|HLL_SPARSE_VAL_BIT; \
} while(0)

其余的设置ZERO、XZERO的长度也是这个原理：

#define HLL_SPARSE_ZERO_SET(p,len) do { \
    *(p) = (len)-1; \
} while(0)
#define HLL_SPARSE_XZERO_SET(p,len) do { \
    int _l = (len)-1; \
    *(p) = (_l>>8) | HLL_SPARSE_XZERO_BIT; \
    *((p)+1) = (_l&0xff); \
} while(0)

4.2.3. 相干函数

HLL应用了一个通用的hash算法，在不同的计算机架构上都能够应用，这里不再叙述，本文只关注HLL的实现算法。

4.2.3.1. ADD

HLL只有增加数据能力进行统计。redis实现了两种ADD，别离利用于dense、sparse。

(1) hllPatLen

其中，这两种模式都须要一个函数来统计该数据hash值的第一个1的地位。

int hllPatLen(unsigned char *ele, size_t elesize, long *regp)

当客户端将一个string增加给HLL时，这个函数返回其局部hash子串的最长0綴，也是第一个1呈现的地位，而后加1返回。

具体如下步骤：

计算增加HLL的string元素的64位hash值
通过hash值和0b0011 1111进行AND操作以取得对应的桶索引，上图对应13号桶
而后从第6位开始统计最长0綴：5，将其加一就是第一个1所在的地位

(2) hllAdd

/* Call hllDenseAdd() or hllSparseAdd() according to the HLL encoding. */
int hllAdd(robj *o, unsigned char *ele, size_t elesize)

所有要增加给HLL的数据都通过hllAdd这个函数进行。

这个函数通过o指向的hllhdr的编码模式不同，别离调用hllDenseAdd或hllSparseAdd。

    switch(hdr->encoding) {
    case HLL_DENSE: return hllDenseAdd(hdr->registers,ele,elesize);
    case HLL_SPARSE: return hllSparseAdd(o,ele,elesize);
    default: return -1; /* Invalid representation. */

(3) hllDenseAdd

int hllDenseAdd(uint8_t *registers, unsigned char *ele, size_t elesize)

这个函数向HLL的dense模式寄存器增加元素ele。

参数registers是以sds的模式贮存的，因而其长度蕴含16384个6bit寄存器加上sds的null终止符。

这个函数的逻辑就很简略了。

应用hllPatLen取得ele的hash值对应的桶索引index和最长0綴count
获取index地位寄存器的值oldcount
如果oldcount < count，就将该地位寄存器设置为count，返回1；否则返回0

(4) hllSparseAdd

int hllSparseAdd(robj *o, unsigned char *ele, size_t elesize)

这个函数向HLL的sparse模式数据结构中增加元素ele。

实际上也不会把ele增加进去，而是把计算的最长0綴增加在HLL中。

参数o实际上是一个持有HLL的string对象，这个函数应用这样的对象是有益处的，就是能够在须要的时候扩大这个string，在它前面增加须要的字节。

在函数中，HLL可能会从sparse转换为dense模式贮存数据。起因有两个：须要设置的寄存器值超过了sparse反对的范畴；增加之后的sparse数据的大小超过了server.hll_sparse_max_bytes。

首先，计算新元素的索引index和最长0綴count。

如果count > 32，阐明sparse无奈应用了，转换为dense模式，而后调用hllDenseAdd并返回。

如果count <= 32，进行后续计算。

在增加数据时可能呈现XZERO别离成XZERO-VAL-XZERO的状况，这也是最简单的状况，因而应用sdsMakeRoomFor增加足够的空间。

步骤一：定位须要批改的操作码

XZERO占用两个字节，ZERO和VAL占用一个字节；通过这些操作码中贮存的长度与index比拟以取得须要更新的操作码地位：*p。

步骤二：在另一块内存中更新操作码

通过步骤一的计算后，变量first指的是p指向的以后操作码中蕴含的第一个寄存器索引地位。

变量next和prev别离保留前面和后面一个操作码。如果next是null阐明p指向的操作码是最初一个；如果prev是null阐明p指向的操作码是第一个。

变量span以后操作码笼罩的寄存器数量。

更新操作码具备不同的状况：

A) 如果以后操作码是VAL并且其值 >= count，那就不须要更新以后操作码，函数返回0示意没有数据更新

B) 如果以后操作码是VAL并且长度是1，阐明以后操作码只笼罩一个寄存器，那间接更新这个操作码的值为count

C) 如果以后操作码是ZERO并且长度是1，那间接把这个操作码改成VAL并且更新值为count，长度为1

D) 剩下的就是更广泛的状况了。例如，以后操作码是长度大于1的VAL、长度大于1的ZERO或者一个XZERO。这种状况下，原来的操作码须要决裂成多个操作码。最简单的就是XZERO决裂成XZERO-VAL-XZERO，这将须要5个字节贮存。

redis将新的操作码序列写到一个额定的缓冲区new，长度是newlen。之后这个新序列会替换就序列。新序列可能会比旧序列长，因而在插入新序列时可能要将原操作码右侧的字节向后挪动。

步骤三：应用新序列替换旧操作码序列，具体看代码。
步骤四：如果间断的操作码值雷同的话，合并这些操作码。

hllSparseAdd的代码太长了，不适宜在博客中贴出来，能够看我在文章结尾提交到github的代码。

4.2.3.2. count

(1) hllCount

uint64_t hllCount(struct hllhdr *hdr, int *invalid)

这个函数返回HLL的近似基数统计值，基于所有寄存器的和谐平均数。如果这个HLL对象的sparse是有效的，invalid会设置为非零值。

hllCount反对一个非凡的外部编码：HLL_RAW。HLL_RAW应用8bit寄存器而不是HLL_DENSE的6bit寄存器，这样会减速PFCOUNT的计算。

在函数中，为了减速计算，redis提前构建了一个表PE，长度为64，$$PE[i] = \frac{1}{2^i}$$。这样之后就能够查表进行计算。

    static int initialized = 0;
    static double PE[64];
    // 应用initialized来初始化一次PE
    if (!initialized) {
        PE[0] = 1; /* 2^(-reg[j]) is 1 when m is 0. */
        for (j = 1; j < 64; j++) {
            /* 2^(-reg[j]) is the same as 1/2^reg[j]. */
            PE[j] = 1.0/(1ULL << j);
        }
        /**
         * PE[1] = 1/2
         * PE[2] = 1/4
         * PE[3] = 1/8
         * ...
         */
        initialized = 1;
    }

接下来，依据HLL的编码模式抉择hllDenseSum、hllSparseSum或hllRawSum计算$SUM(2^{-register[0..i]})$，记为E。

/* Compute SUM(2^-register[0..i]). */
    if (hdr->encoding == HLL_DENSE) {
        E = hllDenseSum(hdr->registers,PE,&ez);
    } else if (hdr->encoding == HLL_SPARSE) {
        E = hllSparseSum(hdr->registers,
                         sdslen((sds)hdr)-HLL_HDR_SIZE,PE,&ez,invalid);
    } else if (hdr->encoding == HLL_RAW) {
        E = hllRawSum(hdr->registers,PE,&ez);
    } else {
        redisPanic("Unknown HyperLogLog encoding in hllCount()");
    }

依据E的范畴采取不同的算法：当基数统计小于HLL桶的四分之一时应用LINEARCOUNTING算法；当基数统计更大时，通过一个bias变量调节计算误差。

    if (E < m*2.5 && ez != 0) {
        E = m*log(m/ez); /* LINEARCOUNTING() */
    } else if (m == 16384 && E < 72000) {
        /* We did polynomial regression of the bias for this range, this
         * way we can compute the bias for a given cardinality and correct
         * according to it. Only apply the correction for P=14 that's what
         * we use and the value the correction was verified with. */
        double bias = 5.9119*1.0e-18*(E*E*E*E)
                      -1.4253*1.0e-12*(E*E*E)+
                      1.2940*1.0e-7*(E*E)
                      -5.2921*1.0e-3*E+
                      83.3216;
        E -= E*(bias/100);
    }

(2) hllDenseSum

double hllDenseSum(uint8_t *registers, double *PE, int *ezp)

这个函数是计算dense模式下各个寄存器的$SUM(2^{-register[0..i]})$。

最简略的就是通过之前的宏定义在16384次循环中获取每个寄存器的值，并通过传入的PE表计算总和。而在redis中，一次循环计算16个寄存器，循环1024次以减速计算。在计算时，PE表中的元素是double值，redis将每个寄存器值映射在PE表中的后果两两相加以打消误差。

/* Additional parens will allow the compiler to optimize the
             * code more with a loss of precision that is not very relevant
             * here (floating point math is not commutative!). */
            // 两两相加减小误差
            E += (PE[r0] + PE[r1]) + (PE[r2] + PE[r3]) + (PE[r4] + PE[r5]) +
                 (PE[r6] + PE[r7]) + (PE[r8] + PE[r9]) + (PE[r10] + PE[r11]) +
                 (PE[r12] + PE[r13]) + (PE[r14] + PE[r15]);

(3) hllSparseSum

double hllSparseSum(uint8_t *sparse, int sparselen, double *PE, int *ezp, int *invalid)

这个函数就是将sparse指向的每个字节进行辨认，判断是哪一种操作码，而后通过查PE表计算总和返回。

(4) hllRawSum

double hllRawSum(uint8_t *registers, double *PE, int *ezp)

这个函数和之前的思路一样，它应用8bit寄存器贮存内容，并且在一次循环中计算8个寄存器的内容。

4.2.3.3. sparse to dense

int hllSparseToDense(robj *o)

这个函数用来将sparse转换为dense，转换条件是：新元素的最长0綴 > 32或以后sparse模式的数据长度超过了server.hll_sparse_max_bytes。

HLL中，redis应用sds来贮存sparse和dense模式的数据。

该函数的实现逻辑也比较简单，前提是本文之前对于dense、sparse以及各种操作码的内容都了解了。

应用sdsnewlen调配HLL_DENSE_SIZE大小的内存dense，初始化index索引为0
遍历参数o指向的sparse数据，并以此设置index指向的dense寄存器内容：
- 如果是ZERO和XZERO，间接设置该操作码笼罩的寄存器为0，实际上也没有设置，间接跳过这些寄存器了，减少index相应的值。
- 如果是VAL，取出该操作码的值和长度，将其笼罩的dense寄存器设置为该值，减少index。
开释sparse数据占用的内存。

5. 总结

乍一开始可能感觉HyperLogLog好难，还要学概率，还有什么伯努利过程，然而它就是单纯的一个公式就解决了，急躁看上来还是很有播种的，下一步能够依据这些内容应用golang实现一个本人的HyperLogLog来加深了解。

关于redis:hyperloglog原理

1. 需要

2. 伯努利试验

3. HyperLogLog

4. redis HLL实现

4.1. HLL介绍

4.1.1. HLL header

4.1.2. dense模式

4.1.3. sparse模式

4.2. redis HLL 实现代码

4.2.1. 相干定义和宏

4.2.2. 位运算的宏

4.2.2.1. dense运算

4.2.2.2. sparse运算

4.2.3. 相干函数

4.2.3.1. ADD

4.2.3.2. count

4.2.3.3. sparse to dense

5. 总结

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于redis:hyperloglog原理

1. 需要

2. 伯努利试验

3. HyperLogLog

4. redis HLL实现

4.1. HLL介绍

4.1.1. HLL header

4.1.2. dense模式

4.1.3. sparse模式

4.2. redis HLL 实现代码

4.2.1. 相干定义和宏

4.2.2. 位运算的宏

4.2.2.1. dense运算

4.2.2.2. sparse运算

4.2.3. 相干函数

4.2.3.1. ADD

4.2.3.2. count

4.2.3.3. sparse to dense

5. 总结

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复