共计 3666 个字符,预计需要花费 10 分钟才能阅读完成。
摘要:华为云 GaussDB(for mysql)是华为云自主研发的最新一代云原生数据库,采用计算存储分离、日志即数据的架构设计。具备极致可靠、极致性价比、多为扩展、完全可信等诸多特性。
一、GaussDB(for mysql)简介
华为云 GaussDB(for mysql)是华为云自主研发的最新一代云原生数据库,采用计算存储分离、日志即数据的架构设计。通过 IO 卸载、日志压缩合并、批量处理、软硬件垂直整合等技术,使数据库性能方面有了大幅提升。同时存储层采用多副本,多 az 部署,增强数据可靠性。具备极致可靠、极致性价比、多为扩展、完全可信等诸多特性。
GaussDB(for mysql)采用了计算存储分离、日志即数据的架构,一部分计算能力下推到存储层。存储层需要通过 consolidation 不断将写入的日志应用到页面上,从而将日志回收掉。另外 SQL 层从存储层读取页面时,也需要将日志回放到相应的版本从而获得对应版本的页面。如果每次都从磁盘读取页面,IO 时延较大,这里将成为整个回放流程的瓶颈。
根据数据库一贯的做法,我们需要一个缓存(bufferpool),把经常访问的页面放在缓存中,从而加快页面读取的速度。但是存储层能够分配给 bufferpool 的资源非常有限,我们需要根据 bufferpool 的使用特点设计一个高效的缓存策略。
二、一些常见的缓存淘汰算法
缓存一般从以下三个特征进行描述:
- 命中率
返回正确结果数 / 请求缓存次数,命中率问题是缓存中的一个非常重要的问题,它是衡量缓存有效性的重要指标。命中率越高,表明缓存的使用率越高。
- 最大元素(或最大空间)
缓存中可以存放的最大元素的数量,一旦缓存中元素数量超过这个值(或者缓存数据所占空间超过其最大支持空间),那么将会触发缓存启动清空策略根据不同的场景合理的设置最大元素值往往可以一定程度上提高缓存的命中率,从而更有效的时候缓存。
- 淘汰(替换)策略
如上描述,缓存的存储空间有限制,当缓存空间被用满时,如何保证在稳定服务的同时有效提升命中率?这就由淘汰(替换)策略来处理,设计适合自身数据特征的淘汰策略能有效提升命中率。
因此,选择一个适合使用场景的淘汰(替换)策略非常重要,能够大大提升缓存命中率,从而加速业务处理。
缓存的淘汰(替换)根据访问模式可以分为基于时间或者访问频率两类,下面分别对这两类进行详细描述。
基于访问时间:此类算法按各缓存项的被访问时间来组织缓存队列, 决定替换对象,如 LRU。
基于访问频率:此类算法用缓存项的被访问频率来组织缓存。如 LFU、LRU-2、2Q、LIRS。
1. LRU
基本思想:如果数据最近被访问过,那么将来被访问的几率也更高
常见实现方法:
一般采用 unordered_map+list 来实现,访问数据时,直接从 unordered_map 通过 key 在 O(1)时间内获取到所需数据。有新数据时,插入到链表的头部;当缓存命中时,也将数据移动到链表头部;当缓存满时将链表尾部的数据丢弃。
命中率分析
当存在热点数据时,LRU 的效率很好,但偶发性的、周期性的批量操作会导致 LRU 命中率急剧下降,缓存污染情况比较严重。
Mysql 对朴素 LRU 算法的改进:
由于朴素的 LRU 算法会存在缓存污染问题,若直接读取到的页放入到 LRU 的首部,那么某些 SQL 操作可能会使缓冲池中的页被刷新出,从而影响缓冲池的效率。常见的这类操作为索引或数据的扫描操作。这类操作需要访问表中的许多页,甚至是全部的页,而这些页通常来说又仅在这次查询操作中需要,并不是活跃的热点数据。如果页被放入 LRU 列表的首部,那么非常可能将所需要的热点数据页从 LRU 列表移除,而在下一次需要读取该页时,InnoDB 存储引擎需要再次访问磁盘。
解决方案:
InnoDB 存储引擎引入了另一个参数来进一步管理 LRU 列表,这个参数是 Innodb_old_blocks_time,用于表示页读取到 mid 位置后需要等待多久才会被加入到 LRU 列表的热端。链表按照 5:3 的比例分为 young 区和 old 区,新加入的数据放在 old 区,若 old 区的数据在 LRU 链表中存在时间超过了 1 秒,则将其移动到链表头部,如果数据在 LRU old 区链表中存在的时间少于 1 秒,则保持位置不变,淘汰时优先淘汰 old 区的数据。这样可以避免全表扫描对 LRU 链表的污染,全表扫描的冷数据很快会被淘汰出去。
2. LFU
基本思想:如果数据过去被访问多次,那么将来被访问的频率也更高。
注意 LFU 和 LRU 的区别,LRU 的淘汰规则是基于 访问时间 ,而 LFU 是基于 访问次数常见实现方法:
与 LRU 类似,LFU 一般也采用 unordered_map+list 来实现,访问数据时,直接从 unordered_map 通过 key 在 O(1)时间内获取到所需数据。有新数据时,插入到链表的尾部;
当缓存命中时,增加该 key 的引用计数,链表按照引用计数排序。为了避免节点在链表中频繁移动,一般会将链表划分为多个区域或者使用多个链表,如果引用计数落入某个范围,将该节点加入到相应的链表中,当引用计数超出阈值时将当前节点移动到上一个区间的链表。当缓存满时将引用计数最小的区域的数据丢弃。
命中率分析
LFU 命中率要优于 LRU,且能够避免周期性或者偶发性的操作导致缓存命中率下降的问题,但 LFU 需要记录数据的历史访问记录,一旦数据访问模式改变,LFU 需要更长时间来适用新的访问模式,即 LFU 存在历史数据影响将来数据的 ” 缓存污染 ” 问题。
3. LRU-K
LRU- K 中的 K 代表最近使用的次数,因此 LRU 可以认为是 LRU-1。LRU- K 的主要目的是为了解决 LRU 算法 ” 缓存污染 ” 的问题,其核心思想是将 ” 最近使用过 1 次 ” 的判断标准扩展为 ” 最近使用过 K 次 ”
常用实现如下:
数据第一次被访问,加入到访问历史列表;如果数据在访问历史列表里后没有达到 K 次访问,则按照 LRU 淘汰;当访问历史队列中的数据访问次数达到 K 次后,将数据索引 从历史队列删除,将数据移到缓存队列中 ,并缓存此数据,缓存队列重新按照时间排序;缓存数据队列中被再次访问后,重新排序;需要淘汰数据时, 淘汰缓存队列 中排在末尾的数据,即淘汰 ” 倒数第 K 次访问离现在最久 ” 的数据。
命中率分析:
LRU- K 具有 LRU 的优点,同时能够避免 LRU 的缺点,实际应用中 LRU- 2 是综合各种因素后最优的选择,LRU- 3 或者更大的 K 值命中率会高,但适应性差,需要大量的数据访问才能将历史访问记录清除掉。LRU- K 降低了 ” 缓存污染 ” 带来的问题,命中率比 LRU 要高。
4. 2Q
算法类似于 LRU-2,不同点在于 2Q 将 LRU- 2 算法中的访问历史队列改为一个 FIFO 队列,即 2Q 有两个缓存队列:FIFO 队列和 LRU 队列
常见实现方法:
当数据第一次访问时,2Q 算法将数据缓存在 FIFO 队列里面,当数据第二次被访问时,则将数据从 FIFO 队列移到 LRU 队列里面,两个队列各自按照自己的方法淘汰数据。
命中率分析:
2Q LRU- K 类似,都是 LRU 的改进版,命中率比 LRU 要高,可以避免 LRU 污染带来的问题。
上面介绍了 4 个常用的缓存淘汰算法,实现起来也不是很复杂。当然还有一些其他的算法,这里就不再介绍了,感兴趣的朋友可以查找资料学习一下。
三、GaussDB(for mysql)bufferpool 的缓存策略
GaussDB(for mysql)目前支持两种缓存淘汰策略:LRU 和 LFU,这两种淘汰算法都是改进过的。
1. 改进的 LFU 算法:
LFU 在实现上采用 unordered_map+list 方式实现,访问数据时,直接从 unordered_map 通过 key 在 O(1)时间内获取到所需数据。为了避免数据在链表中频繁移动,将链表按照引用计数分成多个区间,当缓存命中时,增加引用计数,若引用计数仍落在原来的区间,保持数据在链表中的位置不动,如果引用计数落入新的区间,将数据移动到相应位置。
为了避免一些频繁访问的数据后面不再访问,但是引用计数很大,导致不能被淘汰,因此引入“老化”策略,每隔一段时间将引用计数值衰减一下,这样就可以将一些引用计数较大,但是当前不怎么访问的数据淘汰出去。
一些被淘汰出去的数据我们还会在历史记录里面保留一段时间其对应的引用计数,下次该数据再次被加入缓存时,可以“投胎转世”,可以在上次的引用计数基础上开始计数。这样可以更精确的反应数据被访问的频率。
LFU 的缓存命中率较高,但是在“老化”的过程中需要对链表加锁,这样会阻塞其他地方的访问。
2. 改进的 LRU 算法:
与 mysql 的改进 LRU 算法类似,也是将链表划分为 hot 和 cold 两个区,数据第一次被加入时先放入 cold 区,当再次命中时移入 hot 区。淘汰时优先淘汰 cold 区的数据。同时我们引入了一个 lockfree 的队列,以免在 flush page 时对链表加锁,增强缓冲操作的并发度。
四、下一步的改进
虽然我们引入了改进版的 LRU 和 LFU 算法,但是在大数据量时,按照一些模拟分析数据,还有一定的改进空间。后面在两个算法的基础上进一步改进,提升缓存的命中率。
点击关注,第一时间了解华为云新鲜技术~