数据结构与算法——LRU缓存

原创

wx61a5e0b4aa279 2021-12-04 15:30:16 博主文章分类：数据结构与算法 ©著作权

文章标签 缓存双向链表键值对数据数据值 文章分类 数据结构与算法人工智能

©著作权归作者所有：来自51CTO博客作者wx61a5e0b4aa279的原创作品，请联系作者获取转载授权，否则将追究法律责任

一、LRU缓存

LRU（least recently used）最近最少使用缓存机制，在计算机的缓存满时，会最先淘汰近期最少使用的数据。示意图如下图所示：

数据结构与算法——LRU缓存_键值对设缓存的大小为5，在缓存未满之前，ABCDEF依次进入缓存。当要缓存F时，A近期没有被使用，因此淘汰掉，F放到头的位置，剩下的往后挪。当再次进来C的时候，因为缓存里已经有C了，因此把C提到缓存的头来。再进来G的时候，G放到头，剩下的往后挪。

二、实现LRU缓存

此题为leetcode第146题

运用你所掌握的数据结构，设计和实现一个 LRU (最近最少使用) 缓存机制。它应该支持以下操作：获取数据 get 和写入数据 put 。

获取数据 get(key) ：如果密钥 (key) 存在于缓存中，则获取密钥的值（总是正数），否则返回 -1。
写入数据 put(key, value) - 如果密钥已经存在，则变更其数据值；如果密钥不存在，则插入该组「密钥/数据值」。当缓存容量达到上限时，它应该在写入新数据之前删除最久未使用的数据值，从而为新的数据值留出空间。

import collections
class LRUCache:
    def __init__(self, capacity: int):
        self.dic = collections.OrderedDict()
        self.remain = capacity

    def get(self, key: int) -> int:
        if key not in self.dic:
            return -1
        v = self.dic.pop(key)   # 获取指定key的value，并在字典中删除
        self.dic[key] = v       # 将key作为最新的一个
        return v

    def put(self, key: int, value: int) -> None:
        if key in self.dic:
            self.dic.pop(key)
        else:
            if self.remain > 0:
                self.remain -= 1
            else:
                # popitem(): 先进后出
                # last为False时，删除最先放进来的键值对对并返回该键值对
                self.dic.popitem(last=False)    
        self.dic[key] = value

此题用时也可以用双链表+hash表来解决，数据结构如下所示。双向链表按照被使用的顺序存储了这些键值对，靠近头部的键值对是最近使用的，而靠近尾部的键值对是最久未使用的；哈希表即为普通的哈希映射，通过缓存数据的键映射到其在双向链表中的位置。

数据结构与算法——LRU缓存_数据值_02

我们首先使用哈希表进行定位，找出缓存项在双向链表中的位置，随后将其移动到双向链表的头部，即可在O(1)的时间内完成get或者put操作。具体的方法如下：

对于get操作，首先判断key是否存在：
- 如果key不存在则返回-1
- 如果key存在，则key对应的节点是最近被使用的节点。通过哈希表定位到该节点在双向链表中的位置，并将其移动到双向链表的头部，最后返回该节点的值。
对于 put 操作，首先判断 key 是否存在：
- 如果key不存在，使用key和value创建一个新的节点，在双向链表的头部添加该节点，并将key和该节点添加进哈希表中。然后判断双向链表的节点数是否超出容量，如果超出容量，则删除双向链表的尾部节点，并删除哈希表中对应的项；
- 如果key存在，则与get操作类似，先通过哈希表定位，再将对应的节点的值更新为value，并将该节点移到双向链表的头部

class DLinkNode:
    def __init__(self, key=0, val=0):
        self.key = key
        self.val = val
        self.prev = None
        self.next  =None

class LRUCache:
    def __init__(self, capacity: int):
        self.hash = {}
        self.head = DLinkNode()     # 头结点
        self.tail = DLinkNode()     # 尾节点
        self.head.next = self.tail
        self.tail.next = self.head
        self.capacity = capacity
        self.size = 0

    def get(self, key: int) -> int:
        # 如果键不再hash中返回-1
        if key not in self.hash:
            return -1
        # 键在hash中，获得节点，并将其移到头部
        node = self.hash[key]
        self.move_to_head(node)
        return node.val

    def put(self, key: int, value: int) -> None:
        if key in self.hash:        # key在hash中
            node = self.hash[key]   # 获得节点
            node.val = value        # 修改节点值
            self.move_to_head(node) # 将节点移到头部
        else:   # key不在hash中
            node = DLinkNode(key, value)    # 新建节点
            self.hash[key] = node           # 将节点添加到hash索引
            self.add_to_head(node)          # 添加到头部
            self.size += 1                  # 当前链表节点数加1
            if self.size > self.capacity:   # 如果节点数超过容量
                remove = self.remove_tail() # 移除尾部节点
                self.hash.pop(remove.key)   # hash中弹出尾部节点
                self.size -= 1              # 节点数减1

    # 添加节点到头部
    def add_to_head(self, node):
        node.next = self.head.next
        node.prev = self.head
        self.head.next.prev = node
        self.head.next = node

    # 移动节点到头部
    def move_to_head(self, node):
        self.remove_node(node)
        self.add_to_head(node)

    # 删除节点
    def remove_node(self, node):
        node.prev.next = node.next
        node.next.prev = node.prev

    # 产出尾部节点
    def remove_tail(self):
        node = self.tail.prev
        self.remove_node(node)
        return node