上次的文章介绍了 LRU 算法,明天打算来介绍一下 LFU 算法。在上篇文章中有提到, LFU(Least frequently used:起码应用)算法与 LRU 算法只是在淘汰策略上有所不同,LRU 偏向于保留最近有应用的数据,而 LFU 偏向于保留应用频率较高的数据。

举一个简略的:缓存中有 A、B 两个数据,且已达到下限,如果 数据 A 先被拜访了 10 次,而后 数据 B 被拜访 1 次,当存入新的 数据 C 时,如果以后是 LRU 算法,会将 数据 A 淘汰,而如果是 LFU 算法,则会淘汰 数据 B

简略来说,就是在 LRU 算法中,不论拜访的频率,只有最近拜访过,就不会将这个数据淘汰,而在 LFU 算法中,将拜访的频率作为权重,只有拜访频率越高,该数据就越不会被淘汰,即便该数据很久没有被拜访过。

算法实现

咱们还是通过一段 JavaScript 代码来实现这个逻辑。

class LFUCache {    freqs = {} // 用于标记拜访频率    cache = {} // 用于缓存所有数据    capacity = 0 // 缓存的最大容量    constructor (capacity) {    // 存储 LFU 可缓存的最大容量        this.capacity = capacity    }}

与 LRU 算法一样,LFU 算法也须要实现 getput 两个办法,用于获取缓存和设置缓存。

class LFUCache {  // 获取缓存    get (key) { }  // 设置缓存    put (key, value) { }}

老规矩,先看设置缓存的局部。如果该缓存的 key 之前存在,须要更新其值。

class LFUCache {  // cache 作为缓存的存储对象  // 其解构为: { key: { freq: 0, value: '' } }  // freq 示意该数据读取的频率;  // value 示意缓存的数据;    cache = {}  // fregs 用于存储缓存数据的频率  // 其解构为: { 0: [a], 1: [b, c], 2: [d] }  // 示意 a 还没被读取,b/c 各被读取1次,d被读取2次  freqs = {}  // 设置缓存  put (key, value) {    // 先判断缓存是否存在    const cache = this.cache[key]    if (cache) {      // 如果存在,则重置缓存的值      cache.value = value      // 更新应用频率      let { freq } = cache      // 从 freqs 中获取对应 key 的数组      const keys = this.freqs[freq]      const index = keys.indexOf(key)      // 从频率数组中,删除对应的 key      keys.splice(index, 1)      if (keys.length === 0) {        // 如果以后频率曾经不存在 key        // 将 key 删除        delete this.freqs[freq]      }      // 更新频率加 1      freq = (cache.freq += 1)      // 更新频率数组      const freqMap =            this.freqs[freq] ||            (this.freqs[freq] = [])      freqMap.push(key)      return    }  }}

如果该缓存不存在,要先判断缓存是否超过容量,如果超过,须要淘汰掉应用频率最低的数据。

class LFUCache {  // 更新频率  active (key, cache) {    // 更新应用频率    let { freq } = cache    // 从 freqs 中获取对应 key 的数组    const keys = this.freqs[freq]    const index = keys.indexOf(key)    // 从频率数组中,删除对应的 key    keys.splice(index, 1)    if (keys.length === 0) {      // 如果以后频率曾经不存在 key      // 将 key 删除      delete this.freqs[freq]    }    // 更新频率加 1    freq = (cache.freq += 1)    // 更新读取频率数组    const freqMap = this.freqs[freq] || (this.freqs[freq] = [])    freqMap.push(key)  }  // 设置缓存  put (key, value) {    // 先判断缓存是否存在    const cache = this.cache[key]    if (cache) {      // 如果存在,则重置缓存的值      cache.value = value      this.active(key, cache)      return    }    // 判断缓存是否超过容量    const list = Object.keys(this.cache)    if (list.length >= this.capacity) {      // 超过存储大小,删除拜访频率最低的数据      const [first] = Object.keys(this.freqs)      const keys = this.freqs[first]      const latest = keys.shift()      delete this.cache[latest]      if (keys.length === 0) delete this.freqs[latest]    }    // 写入缓存,默认频率为0,示意还未应用过    this.cache[key] = { value, freq: 0 }    // 写入读取频率数组    const freqMap = this.freqs[0] || (this.freqs[0] = [])    freqMap.push(key)  }}

实现了设置缓存的办法后,再实现获取缓存就很容易了。

class LRUCache {  // 获取数据    get (key) {        if (this.cache[key] !== undefined) {        // 如果 key 对应的缓存存在,更新其读取频率      // 之前曾经实现过,能够间接复用            this.active(key)            return this.cache[key]        }        return undefined  }}

对于 LFU 缓存算法实现就到这里了,当然该算法个别应用双链表的模式来实现,这里的实现形式,只是为了不便了解其原理,感兴趣的话能够在网上搜寻下更加高效的实现形式。