关于缓存:缓存淘汰算法

缓存淘汰策略的实现
从实质上来说，缓存算法并没有好坏之分，只有是否实用以后的业务场景。因而依据不同的业务场景设置不同的缓存算法会使缓存命中率更高。

FIFO（First in First out）先进先出。能够了解为是一种相似队列的算法实现

实现概念：最先进来的数据，被认为在将来被拜访的概率也是最低的，因而，当规定空间用尽且须要放入新数据的时候，会优先淘汰最早进来的数据。

长处：没什么长处

毛病：算法逻辑设计所实现的缓存的命中率是比拟低，没有任何额定逻辑可能尽可能的保障罕用数据不被淘汰掉。

LRU（The Least Recently Used）最近最久未应用算法

实现概念：如果一个数据最近很少被拜访到，那么被认为在将来被拜访的概率也是最低的，当规定空间用尽且须要放入新数据的时候，会优先淘汰最久未被拜访的数据。

长处：LRU 很好的应答了针对于突发流量涌入的状况

毛病：对于周期性、偶发性的拜访数据，有大概率可能造成缓存净化，置换进来了热点数据，把这些偶发性数据留下了，从而导致 LRU 的数据命中率急剧下降。

例如：当一个新剧热播，流量涌入，此剧的相干缓存登顶。但当新剧热度升高趋势变得平缓，其余周期性播出的综艺类节目涌入后将新剧缓存挤出，这是我又拜访新剧，则不得不又将新剧退出缓存，这显然不合时宜，因为新剧我曾经拜访过很屡次了。

LFU（The Least Frequently Used）最近很少应用算法，与 LRU 的区别在于 LRU 是以工夫掂量，LFU 是以时间段内的次数

实现概念：如果一个数据在肯定工夫内被拜访的次数很低，那么被认为在将来被拜访的概率也是最低的，当规定空间用尽且须要放入新数据的时候，会优先淘汰时间段内拜访次数最低的数据。

针对以上的实现概念能够看出，它相较于 LRU 其多出了拜访次数的概念，能够了解为当有缓存命中时其对应该缓存的计数器会 +1。

长处：LFU 无效的爱护了缓存，因为是以次数为基准所以更加精确，针对于拜访概率差不多时，缓存命中率较高。

毛病：LFU 须要额定的空间来存储计数器来记录拜访频次。针对于一个数据的洪峰。起初又瘦弱，因为其频率过高导致其缓存很难生效。

例如：当一个新剧热播，流量涌入，此剧的相干缓存登顶。但当新剧热度升高趋势变得平缓，然而因为其缓存命中次数过高，导致其缓存始终处于缓存队列中，始终不会生效，直到残余所有缓存计数都超过了此缓存才将其排出。

W-TinyLFU（Window Tiny Least Frequently Used）是对 LFU 的的优化和增强

实现概念：当一个数据进来的时候，会进行筛选比拟，进入 W -LRU 窗口队列，以此应答流量突增，通过淘汰后进入过滤器，通过拜访拜访频率裁决是否进入缓存。如果一个数据最近被拜访的次数很低，那么被认为在将来被拜访的概率也是最低的，当规定空间用尽的时候，会优先淘汰最近拜访次数很低的数据

它也存储一个次数，但它为什么是对 LFU 的优化呢，因为其存储的值为 Count-Min Sketch，Count-Min Sketch 是一个 hash 操作，它扩增为多个 hash，在多个 hash 地址上记录缓存命中次数。这样多个 hash 会导致原来 hash 抵触的概率升高，当查问数据时，且从当多个 hash 获得数据，取出多个 hash 数据中取其中的最小值，来定义为此缓存的命中次数。也就是 Count Min 的含意所在。

当某一个 key 的的计数器大于触发值（k），则整体计数器会除以 2，这样解决了 LFU 的缓存难生效问题。

这样我就能够应用申请固定的空间大小来存储缓存计数，就算是 hash 抵触也没关系，因为从概率上来说我获取的最小值是最精确的。

其相似于布隆过滤器的实现，能够将布隆过滤器看成一种概率性数据结构，实质是高效的插入和查问。相比于传统的 List、Map 其更高效、占用空间更少。其实现是当有变量退出布隆过滤器时，通过 K 个映射函数将变量映射为位图中的 K 个点，将 K 个点的值由 0 置为 1. 当有新的元素退出时候持续映射，就算是点位反复也没关系，该点位仍旧为 1. 当查问时, 元素交于 K 个点。

1、若 k 个地位有一个为 0，则该元素必定不在汇合中

2、若 K 个地位全副为 1，则该元素有可能存在汇合中

长处：在空间和工夫维度上领有微小劣势。

毛病：误差率的存在，利用较少，只有 Caffine 应用此算法。

关于缓存:缓存淘汰算法

一、FIFO

二、LRU

三、LFU

四、W-TinyLFU