关于javascript:什么是-LFU-算法

上次的文章介绍了 LRU 算法，明天打算来介绍一下 LFU 算法。在上篇文章中有提到，LFU（Least frequently used：起码应用）算法与 LRU 算法只是在淘汰策略上有所不同，LRU 偏向于保留最近有应用的数据，而 LFU 偏向于保留应用频率较高的数据。

举一个简略的🌰：缓存中有 A、B 两个数据，且已达到下限，如果 数据 A 先被拜访了 10 次，而后 数据 B 被拜访 1 次，当存入新的 数据 C 时，如果以后是 LRU 算法，会将 数据 A 淘汰，而如果是 LFU 算法，则会淘汰 数据 B。

简略来说，就是在 LRU 算法中，不论拜访的频率，只有最近拜访过，就不会将这个数据淘汰，而在 LFU 算法中，将拜访的频率作为权重，只有拜访频率越高，该数据就越不会被淘汰，即便该数据很久没有被拜访过。

咱们还是通过一段 JavaScript 代码来实现这个逻辑。

class LFUCache {freqs = {} // 用于标记拜访频率
    cache = {} // 用于缓存所有数据
    capacity = 0 // 缓存的最大容量
    constructor (capacity) {
    // 存储 LFU 可缓存的最大容量
        this.capacity = capacity
    }
}

与 LRU 算法一样，LFU 算法也须要实现 get 与 put 两个办法，用于获取缓存和设置缓存。

class LFUCache {
  // 获取缓存
    get (key) { }
  // 设置缓存
    put (key, value) {}}

老规矩，先看设置缓存的局部。如果该缓存的 key 之前存在，须要更新其值。

class LFUCache {
  // cache 作为缓存的存储对象
  // 其解构为: {key: { freq: 0, value: ''} }
  // freq 示意该数据读取的频率；// value 示意缓存的数据；cache = {}
  // fregs 用于存储缓存数据的频率
  // 其解构为: {0: [a], 1: [b, c], 2: [d] }
  // 示意 a 还没被读取，b/c 各被读取 1 次，d 被读取 2 次
  freqs = {}
  // 设置缓存
  put (key, value) {
    // 先判断缓存是否存在
    const cache = this.cache[key]
    if (cache) {
      // 如果存在，则重置缓存的值
      cache.value = value
      // 更新应用频率
      let {freq} = cache
      // 从 freqs 中获取对应 key 的数组
      const keys = this.freqs[freq]
      const index = keys.indexOf(key)
      // 从频率数组中，删除对应的 key
      keys.splice(index, 1)
      if (keys.length === 0) {
        // 如果以后频率曾经不存在 key
        // 将 key 删除
        delete this.freqs[freq]
      }
      // 更新频率加 1
      freq = (cache.freq += 1)
      // 更新频率数组
      const freqMap =
            this.freqs[freq] ||
            (this.freqs[freq] = [])
      freqMap.push(key)
      return
    }
  }
}

如果该缓存不存在，要先判断缓存是否超过容量，如果超过，须要淘汰掉应用频率最低的数据。

class LFUCache {
  // 更新频率
  active (key, cache) {
    // 更新应用频率
    let {freq} = cache
    // 从 freqs 中获取对应 key 的数组
    const keys = this.freqs[freq]
    const index = keys.indexOf(key)
    // 从频率数组中，删除对应的 key
    keys.splice(index, 1)
    if (keys.length === 0) {
      // 如果以后频率曾经不存在 key
      // 将 key 删除
      delete this.freqs[freq]
    }
    // 更新频率加 1
    freq = (cache.freq += 1)
    // 更新读取频率数组
    const freqMap = this.freqs[freq] || (this.freqs[freq] = [])
    freqMap.push(key)
  }
  // 设置缓存
  put (key, value) {
    // 先判断缓存是否存在
    const cache = this.cache[key]
    if (cache) {
      // 如果存在，则重置缓存的值
      cache.value = value
      this.active(key, cache)
      return
    }
    // 判断缓存是否超过容量
    const list = Object.keys(this.cache)
    if (list.length >= this.capacity) {
      // 超过存储大小，删除拜访频率最低的数据
      const [first] = Object.keys(this.freqs)
      const keys = this.freqs[first]
      const latest = keys.shift()
      delete this.cache[latest]
      if (keys.length === 0) delete this.freqs[latest]
    }
    // 写入缓存，默认频率为 0，示意还未应用过
    this.cache[key] = {value, freq: 0}
    // 写入读取频率数组
    const freqMap = this.freqs[0] || (this.freqs[0] = [])
    freqMap.push(key)
  }
}

实现了设置缓存的办法后，再实现获取缓存就很容易了。

class LRUCache {
  // 获取数据
    get (key) {if (this.cache[key] !== undefined) {
        // 如果 key 对应的缓存存在，更新其读取频率
      // 之前曾经实现过，能够间接复用
            this.active(key)
            return this.cache[key]
        }
        return undefined
  }
}

对于 LFU 缓存算法实现就到这里了，当然该算法个别应用双链表的模式来实现，这里的实现形式，只是为了不便了解其原理，感兴趣的话能够在网上搜寻下更加高效的实现形式。