关于redis:深入解析Redis的LRU与LFU算法实现

作者：vivo 互联网服务器团队 – Luo Jianxin

重点介绍了Redis的LRU与LFU算法实现，并剖析总结了两种算法的实现成果以及存在的问题。

一、前言

Redis是一款基于内存的高性能NoSQL数据库，数据都缓存在内存里，这使得Redis能够每秒轻松地解决数万的读写申请。

绝对于磁盘的容量，内存的空间个别都是无限的，为了防止Redis耗尽宿主机的内存空间，Redis外部实现了一套简单的缓存淘汰策略来管控内存使用量。

Redis 4.0版本开始就提供了8种内存淘汰策略，其中4种都是基于LRU或LFU算法实现的，本文就这两种算法的Redis实现进行了具体的介绍，并论述其优劣个性。

二、Redis的LRU实现

在介绍Redis LRU算法实现之前，咱们先简略介绍一下原生的LRU算法。

2.1 LRU算法原理

LRU（The Least Recently Used）是最经典的一款缓存淘汰算法，其原理是：如果一个数据在最近一段时间没有被拜访到，那么在未来它被拜访的可能性也很低，当数据所占据的空间达到肯定阈值时，这个起码被拜访的数据将被淘汰掉。

现在，LRU算法广泛应用在诸多零碎内，例如Linux内核页表替换，MySQL Buffer Pool缓存页替换，以及Redis数据淘汰策略。

以下是一个LRU算法示意图：

向一个缓存空间顺次插入三个数据A/B/C，填满了缓存空间；
读取数据A一次，依照拜访工夫排序，数据A被挪动到缓存头部；
插入数据D的时候，因为缓存空间已满，触发了LRU的淘汰策略，数据B被移出，缓存空间只保留了D/A/C。

一般而言，LRU算法的数据结构不会如示意图那样，仅应用简略的队列或链表去缓存数据，而是会采纳Hash表 + 双向链表的构造，利用Hash表确保数据查找的工夫复杂度是O(1)，双向链表又能够使数据插入/删除等操作也是O(1)。

如果你很相熟Redis的数据类型，你会发现这个LRU的数据结构与ZSET类型OBJ\_ENCODING\_SKIPLIST编码构造类似，只是LRU数据排序形式更简略一些。

2.2 Redis LRU算法实现

依照官网文档的介绍，Redis所实现的是一种近似的LRU算法，每次随机选取一批数据进行LRU淘汰，而不是针对所有的数据，通过就义局部准确率来进步LRU算法的执行效率。

Redis外部只应用Hash表缓存了数据，并没有创立一个专门针对LRU算法的双向链表，之所以这样解决也是因为以下几个起因：

筛选规定，Redis是随机抽取一批数据去依照淘汰策略排序，不再须要对所有数据排序；
性能问题，每次数据拜访都可能波及数据移位，性能会有少许损失；
内存问题，Redis对内存的应用一贯很“抠门”，数据结构都很精简，尽量不应用简单的数据结构治理数据；
策略配置，如果线上Redis实例动静批改淘汰策略会触发全副数据的结构性扭转，这个Redis零碎无奈接受的。

redisObject是Redis外围的底层数据结构，成员变量lru字段用于记录了此key最近一次被拜访的LRU时钟(server.lruclock)，每次Key被拜访或批改都会引起lru字段的更新。

#define LRU_BITS 24
 
typedef struct redisObject {
    unsigned type:4;
    unsigned encoding:4;
    unsigned lru:LRU_BITS; /* LRU time (relative to global lru_clock) or
                            * LFU data (least significant 8 bits frequency
                            * and most significant 16 bits access time). */
    int refcount;
    void *ptr;
} robj;

默认的LRU时钟单位是秒，能够批改LRU\_CLOCK\_RESOLUTION宏来扭转单位，LRU时钟更新的频率也和server.hz参数无关。

unsigned int LRU_CLOCK(void) {
    unsigned int lruclock;
    if (1000/server.hz <= LRU_CLOCK_RESOLUTION) {
        atomicGet(server.lruclock,lruclock);
    } else {
        lruclock = getLRUClock();
    }
    return lruclock;
}

因为lru字段仅占用了24bit的空间，按秒为单位也只能存储194天，所以可能会呈现一个意想不到的后果，即距离194天拜访Key后标记的工夫戳一样，Redis LRU淘汰策略部分生效。

2.3 LRU算法缺点

LRU算法仅关注数据的拜访工夫或拜访程序，疏忽了拜访次数的价值，在淘汰数据过程中可能会淘汰掉热点数据。

如上图所示，时间轴自左向右，数据A/B/C在同一段时间内被别离拜访的数次。数据C是最近一次拜访的数据，依照LRU算法排列数据的热度是C>B>A，而数据的实在热度是B>A>C。

这个是LRU算法的原理性问题，天然也会在Redis 近似LRU算法中出现，为了解决这个问题衍生进去LFU算法。

三、Redis的LFU实现

3.1 LFU算法原理

LFU（Least frequently used）即最不频繁拜访，其原理是：如果一个数据在近期被高频率地拜访，那么在未来它被再拜访的概率也会很高，而拜访频率较低的数据未来很大概率不会再应用。

很多人看到下面的形容，会认为LFU算法次要是比拟数据的拜访次数，毕竟拜访次数多了天然拜访频率就高啊。实际上，拜访频率不能等同于拜访次数，抛开拜访工夫谈拜访次数就是在“耍流氓”。

在这段时间片内数据A被拜访了5次，数据B与C各被拜访了4次，如果依照拜访次数判断数据热度值，必然是A>B=C；如果思考到时效性，间隔以后工夫越近的拜访越有价值，那么数据热度值就应该是C>B>A。因而，LFU算法个别都会有一个工夫衰减函数参加热度值的计算，兼顾了拜访工夫的影响。

LFU算法实现的数据结构与LRU一样，也采纳Hash表 + 双向链表的构造，数据在双向链表内依照热度值排序。如果某个数据被拜访，更新热度值之从新插入到链表适合的地位，这个比LRU算法解决的流程简单一些。

3.2 Redis LFU算法实现

Redis 4.0版本开始减少了LFU缓存淘汰策略，也采纳数据随机筛选规定，而后根据数据的热度值排序，淘汰掉热度值较低的数据。

3.2.1 LFU算法代码实现

LFU算法的实现没有应用额定的数据结构，复用了redisObject数据结构的lru字段，把这24bit空间拆分成两局部去应用。

因为记录时间戳在空间被压缩到16bit，所以LFU改成以分钟为单位，大略45.5天会呈现数值折返，比LRU时钟周期还短。
低位的8bit用来记录热度值（counter），8bit空间最大值为255，无奈记录数据在拜访总次数。

LFU热度值（counter）的算法实现：

#define LFU_INIT_VAL 5
 
/* Logarithmically increment a counter. The greater is the current counter value
 * the less likely is that it gets really implemented. Saturate it at 255. */
uint8_t LFULogIncr(uint8_t counter) {
  if (counter == 255) return 255;
  double r = (double)rand()/RAND_MAX;
  double baseval = counter - LFU_INIT_VAL;
  if (baseval < 0) baseval = 0;
  double p = 1.0/(baseval*server.lfu_log_factor+1);
  if (r < p) counter++;
  return counter;
}

counter 小于或等于 LFU_INIT_VAL 时候，数据一旦被拜访命中， counter靠近100%概率递增1；
counter 大于 LFU_INIT_VAL 时候，须要先计算两者差值，而后作为分母的一部分参加递增概率的计算；
随着counter 数值的增大，递增的概率逐渐衰减，可能数次的拜访都不能使其数值加1；
当counter 数值达到255，就不再进行数值递增的计算过程。

LFU counter的计算也并非“一尘不变”，为了适配各种业务数据的个性，Redis在LFU算法实现过程中引入了两个可调参数：

热度值counter的工夫衰减函数：
 
unsigned long LFUDecrAndReturn(robj *o) {
    unsigned long ldt = o->lru >> 8;
    unsigned long counter = o->lru & 255;
    unsigned long num_periods = server.lfu_decay_time ? LFUTimeElapsed(ldt) / server.lfu_decay_time : 0;
    if (num_periods)
        counter = (num_periods > counter) ? 0 : counter - num_periods;
    return counter;
}

浏览完以上的内容，是否感觉似曾类似？实际上LFU counter计算过程就是对拜访次数进行了数值归一化，将数据拜访次数映射成热度值(counter)，数值的范畴也从[0,+∞)映射到另一个维度的[0,255]。

3.3.2 LFU Counter剖析

仅从代码层面剖析钻研Redis LFU算法实现会比拟形象且干燥，无奈直观的出现counter递增概率的算法成果，以及counter数值与拜访次数的关系。

在lfu_log_factor为默认值10的场景下，利用Python实现Redis LFU算法流程，绘制出LFU counter递增概率曲线图：

能够清晰的察看到，当LFU counter数值超过LFU_INIT_VAL之后，曲线呈现了垂直降落，递增概率陡降到0.2%左右，随后在底部造成一个较为迟缓的衰减曲线，直至counter数值达到255则递增概率归于0，贴合3.3.1章节剖析的实践。

放弃Redis系统配置默认值的状况下，对同一个数据继续的拜访，并采集此数据的LFU counter数值，绘制出LFU counter数值曲线图：

随着拜访次数的一直减少，LFU counter数值曲线呈现出爬坡式的递增，状态趋近于根号曲线，由此揣测出以下观点：

在拜访次数雷同的状况下，counter数值不是固定的，大概率在一个范畴内稳定；
在同一个时间段内，数据之间拜访次数相差上千次，才能够通过counter数值辨别出哪些数据更热，而“温”数据之间可能很难辨别热度。

四、总结

通过对Redis LRU与LFU算法实现的介绍，咱们能够大体理解两种算法策略的优缺点，在Redis运维过程中，能够根据业务数据的个性去抉择相应的算法。

如果业务数据的拜访较为平均，OPS或CPU利用率个别不会呈现周期性的陡升或陡降，数据没有体现出绝对的“冷热”个性，即倡议采纳LRU算法，能够满足个别的运维需要。

相同，业务具备很强时效性，在流动推广或大促期间，业务某些数据会忽然成为热点数据，监控上呈现出OPS或CPU利用率的大幅稳定，为了能抓取热点数据便于前期的剖析或优化，倡议肯定要配置成LFU算法。

在Used_memory靠近Maxmemory的状况下，Redis始终都采纳随机的形式筛选数据，且筛选的个数极其无限，所以，LFU算法无奈展现出较大的劣势，也可能会淘汰掉比拟热的数据。

参考文献：

Key eviction。
Redis的LRU缓存淘汰算法实现（上）
Redis 缓存淘汰策略以及 LRU、LFU 算法

关于redis:深入解析Redis的LRU与LFU算法实现

一、前言

二、Redis的LRU实现

2.1 LRU算法原理

2.2 Redis LRU算法实现

2.3 LRU算法缺点

三、Redis的LFU实现

3.1 LFU算法原理

3.2 Redis LFU算法实现

3.2.1 LFU算法代码实现

3.3.2 LFU Counter剖析

四、总结

评论

发表回复取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

关于redis:深入解析Redis的LRU与LFU算法实现

一、前言

二、Redis的LRU实现

2.1 LRU算法原理

2.2 Redis LRU算法实现

2.3 LRU算法缺点

三、Redis的LFU实现

3.1 LFU算法原理

3.2 Redis LFU算法实现

3.2.1 LFU算法代码实现

3.3.2 LFU Counter剖析

四、总结

评论

发表回复 取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

发表回复取消回复