上次的文章介绍了 LRU 算法,明天打算来介绍一下 LFU 算法。在上篇文章中有提到,LFU(Least frequently used
:起码应用)算法与 LRU 算法只是在淘汰策略上有所不同,LRU 偏向于保留最近有应用的数据,而 LFU 偏向于保留应用频率较高的数据。
举一个简略的🌰:缓存中有 A、B 两个数据,且已达到下限,如果 数据 A
先被拜访了 10 次,而后 数据 B
被拜访 1 次,当存入新的 数据 C
时,如果以后是 LRU 算法,会将 数据 A
淘汰,而如果是 LFU 算法,则会淘汰 数据 B
。
简略来说,就是在 LRU 算法中,不论拜访的频率,只有最近拜访过,就不会将这个数据淘汰,而在 LFU 算法中,将拜访的频率作为权重,只有拜访频率越高,该数据就越不会被淘汰,即便该数据很久没有被拜访过。
算法实现
咱们还是通过一段 JavaScript 代码来实现这个逻辑。
class LFUCache {freqs = {} // 用于标记拜访频率
cache = {} // 用于缓存所有数据
capacity = 0 // 缓存的最大容量
constructor (capacity) {
// 存储 LFU 可缓存的最大容量
this.capacity = capacity
}
}
与 LRU 算法一样,LFU 算法也须要实现 get
与 put
两个办法,用于获取缓存和设置缓存。
class LFUCache {
// 获取缓存
get (key) { }
// 设置缓存
put (key, value) {}}
老规矩,先看设置缓存的局部。如果该缓存的 key 之前存在,须要更新其值。
class LFUCache {
// cache 作为缓存的存储对象
// 其解构为: {key: { freq: 0, value: ''} }
// freq 示意该数据读取的频率;// value 示意缓存的数据;cache = {}
// fregs 用于存储缓存数据的频率
// 其解构为: {0: [a], 1: [b, c], 2: [d] }
// 示意 a 还没被读取,b/c 各被读取 1 次,d 被读取 2 次
freqs = {}
// 设置缓存
put (key, value) {
// 先判断缓存是否存在
const cache = this.cache[key]
if (cache) {
// 如果存在,则重置缓存的值
cache.value = value
// 更新应用频率
let {freq} = cache
// 从 freqs 中获取对应 key 的数组
const keys = this.freqs[freq]
const index = keys.indexOf(key)
// 从频率数组中,删除对应的 key
keys.splice(index, 1)
if (keys.length === 0) {
// 如果以后频率曾经不存在 key
// 将 key 删除
delete this.freqs[freq]
}
// 更新频率加 1
freq = (cache.freq += 1)
// 更新频率数组
const freqMap =
this.freqs[freq] ||
(this.freqs[freq] = [])
freqMap.push(key)
return
}
}
}
如果该缓存不存在,要先判断缓存是否超过容量,如果超过,须要淘汰掉应用频率最低的数据。
class LFUCache {
// 更新频率
active (key, cache) {
// 更新应用频率
let {freq} = cache
// 从 freqs 中获取对应 key 的数组
const keys = this.freqs[freq]
const index = keys.indexOf(key)
// 从频率数组中,删除对应的 key
keys.splice(index, 1)
if (keys.length === 0) {
// 如果以后频率曾经不存在 key
// 将 key 删除
delete this.freqs[freq]
}
// 更新频率加 1
freq = (cache.freq += 1)
// 更新读取频率数组
const freqMap = this.freqs[freq] || (this.freqs[freq] = [])
freqMap.push(key)
}
// 设置缓存
put (key, value) {
// 先判断缓存是否存在
const cache = this.cache[key]
if (cache) {
// 如果存在,则重置缓存的值
cache.value = value
this.active(key, cache)
return
}
// 判断缓存是否超过容量
const list = Object.keys(this.cache)
if (list.length >= this.capacity) {
// 超过存储大小,删除拜访频率最低的数据
const [first] = Object.keys(this.freqs)
const keys = this.freqs[first]
const latest = keys.shift()
delete this.cache[latest]
if (keys.length === 0) delete this.freqs[latest]
}
// 写入缓存,默认频率为 0,示意还未应用过
this.cache[key] = {value, freq: 0}
// 写入读取频率数组
const freqMap = this.freqs[0] || (this.freqs[0] = [])
freqMap.push(key)
}
}
实现了设置缓存的办法后,再实现获取缓存就很容易了。
class LRUCache {
// 获取数据
get (key) {if (this.cache[key] !== undefined) {
// 如果 key 对应的缓存存在,更新其读取频率
// 之前曾经实现过,能够间接复用
this.active(key)
return this.cache[key]
}
return undefined
}
}
对于 LFU 缓存算法实现就到这里了,当然该算法个别应用双链表的模式来实现,这里的实现形式,只是为了不便了解其原理,感兴趣的话能够在网上搜寻下更加高效的实现形式。