LeetCode刷题——哈希表(python语言)

一、哈希表

1.1 哈希表的概念

哈希表,也叫散列表。其实可以很像python的字典,也就是键(key)值(Hash(key))对,最简单也最常用的哈希表就是索引与索引的值具有一定的对应关系,(哈希函数)也就是说,a[0]=3代表数组中元素0的个数为3,可以看到哈希表大部分都被用来统计数据。而a[i]=[i],对于跨度大的数据又会特别浪费内存,所以会有一系列的填充算法。也就是哈希函数的构造,通常有直接定地址法、除留余数法、平方取中法、基数转化法、数字分析法、折叠法、随机数法、乘积法、点积法等。

1.2 哈希冲突

即使出现了如此多的填充算法改进这一问题,但是仍然可能会存在冲突,比如一个key要填充到哈希表,但是该地方已经被占用,这种情况被称为哈希冲突。为了这种情况下有两种方案来解决这一问题。分别是开放地址法和链地址法。
开发地址法:指的是哈希表的空地址向处理冲突开放。比如key已经被用。可以尝试key+1.找其他的位置有很多方法,比如线性探测法,分别从1,2,3,…找。或者二次探测法,从1,-1,4,-4,…等,伪随机数序列,随机的位置。而链地址法,则是将哈希表的数组每一个元素当作表头,冲突的元素通过头插法或者尾插法都放在同一个元素的表头下。

二、刷题

2.1 存在重复元素

给你一个整数数组 nums 。如果任一值在数组中出现 至少两次 ,返回 true ;如果数组中每个元素互不相同,返回 false 。

示例 1:
输入:nums = [1,2,3,1]
输出:true

示例 2:
输入:nums = [1,2,3,4]
输出:false

示例 3:
输入:nums = [1,1,1,3,3,4,3,2,4,2]
输出:true

提示:
1 <= nums.length <= 105
-109 <= nums[i] <= 109

class Solution:
    def containsDuplicate(self, nums: List[int]) -> bool:
        map = dict()
        for i in nums:
            if i not in map:
                map[i] = 1 
            else:
                return True 
        return False

2.2 存在重复元素 II

给你一个整数数组 nums 和一个整数 k ,判断数组中是否存在两个 不同的索引 i 和 j ,满足 nums[i] == nums[j] 且 abs(i - j) <= k 。如果存在,返回 true ;否则,返回 false 。

示例 1:
输入:nums = [1,2,3,1], k = 3
输出:true

示例 2:
输入:nums = [1,0,1,1], k = 1
输出:true

示例 3:
输入:nums = [1,2,3,1,2,3], k = 2
输出:false

提示:
1 <= nums.length <= 105
-109 <= nums[i] <= 109
0 <= k <= 105

class Solution:
    def containsNearbyDuplicate(self, nums: List[int], k: int) -> bool:
        map = dict()
        for i,num in enumerate(nums):
            if num not in map:
                map[num] = i
            else:
                if(abs(i-map[num])<=k):
                    return True 
                else:
                    map[num] = i
        return False

2.3 宝石与石头

给你一个字符串 jewels 代表石头中宝石的类型,另有一个字符串 stones 代表你拥有的石头。 stones 中每个字符代表了一种你拥有的石头的类型,你想知道你拥有的石头中有多少是宝石。

字母区分大小写,因此 “a” 和 “A” 是不同类型的石头。

示例 1:
输入:jewels = “aA”, stones = “aAAbbbb”
输出:3

示例 2:
输入:jewels = “z”, stones = “ZZ”
输出:0

提示:
1 <= jewels.length, stones.length <= 50
jewels 和 stones 仅由英文字母组成
jewels 中的所有字符都是 唯一的

class Solution:
    def numJewelsInStones(self, jewels: str, stones: str) -> int:
        map = {s:1 for s in jewels}
        sum = 0
        for s in stones:
            if(s in map):
                sum += 1 
            else:
                continue
        return sum
class Solution:
    def numJewelsInStones(self, jewels: str, stones: str) -> int:
        
        sum = 0
        for s in stones:
            if(s in jewels):
                sum += 1 
            else:
                continue
        return sum

2.4 有效的数独

请你判断一个 9 x 9 的数独是否有效。只需要 根据以下规则 ,验证已经填入的数字是否有效即可。

数字 1-9 在每一行只能出现一次。
数字 1-9 在每一列只能出现一次。
数字 1-9 在每一个以粗实线分隔的 3x3 宫内只能出现一次。(请参考示例图)

注意:
一个有效的数独(部分已被填充)不一定是可解的。
只需要根据以上规则,验证已经填入的数字是否有效即可。
空白格用 ‘.’ 表示。

示例 1:

输入:board =

[[“5”,“3”,".",".",“7”,".",".",".","."]

,[“6”,".",".",“1”,“9”,“5”,".",".","."]

,[".",“9”,“8”,".",".",".",".",“6”,"."]

,[“8”,".",".",".",“6”,".",".",".",“3”]

,[“4”,".",".",“8”,".",“3”,".",".",“1”]

,[“7”,".",".",".",“2”,".",".",".",“6”]

,[".",“6”,".",".",".",".",“2”,“8”,"."]

,[".",".",".",“4”,“1”,“9”,".",".",“5”]

,[".",".",".",".",“8”,".",".",“7”,“9”]]

输出:true

python 哈希后长度 哈希表 python_leetcode

示例 2:
输入:board =
[[“8”,“3”,".",".",“7”,".",".",".","."]
,[“6”,".",".",“1”,“9”,“5”,".",".","."]
,[".",“9”,“8”,".",".",".",".",“6”,"."]
,[“8”,".",".",".",“6”,".",".",".",“3”]
,[“4”,".",".",“8”,".",“3”,".",".",“1”]
,[“7”,".",".",".",“2”,".",".",".",“6”]
,[".",“6”,".",".",".",".",“2”,“8”,"."]
,[".",".",".",“4”,“1”,“9”,".",".",“5”]
,[".",".",".",".",“8”,".",".",“7”,“9”]]
输出:false
解释:除了第一行的第一个数字从 5 改为 8 以外,空格内其他数字均与 示例1 相同。 但由于位于左上角的 3x3 宫内有两个 8 存在, 因此这个数独是无效的。

提示:
board.length == 9
board[i].length == 9
board[i][j] 是一位数字(1-9)或者 ‘.’

class Solution:
    def isValidSudoku(self, board: List[List[str]]) -> bool:
        rows_map = [dict() for _ in range(9)]
        cols_map = [dict() for _ in range(9)]
        boxes_map = [dict() for _ in range(9)]
        
        for i in range(9):
            for j in range(9):
                if(board[i][j]=='.'):
                    continue
                else:
                    num = int(board[i][j])
                    boxes = (i // 3) * 3  + j // 3
                    rows_num = rows_map[i].get(num,0)
                    cols_num = cols_map[j].get(num,0)
                    boxes_num = boxes_map[boxes].get(num,0)
                    if(rows_num >0 or cols_num>0 or boxes_num >0):
                        return False 
                    rows_map[i][num] = 1 
                    cols_map[j][num] = 1 
                    boxes_map[boxes][num] = 1 
        return True

2.5 子域名访问计数

网站域名 “discuss.leetcode.com” 由多个子域名组成。顶级域名为 “com” ,二级域名为 “leetcode.com” ,最低一级为 “discuss.leetcode.com” 。当访问域名 “discuss.leetcode.com” 时,同时也会隐式访问其父域名 “leetcode.com” 以及 “com” 。

计数配对域名 是遵循 “rep d1.d2.d3” 或 “rep d1.d2” 格式的一个域名表示,其中 rep 表示访问域名的次数,d1.d2.d3 为域名本身。

例如,“9001 discuss.leetcode.com” 就是一个 计数配对域名 ,表示 discuss.leetcode.com 被访问了 9001 次。
给你一个 计数配对域名 组成的数组 cpdomains ,解析得到输入中每个子域名对应的 计数配对域名 ,并以数组形式返回。可以按 任意顺序 返回答案。

示例 1:

输入:cpdomains = [“9001 discuss.leetcode.com”]
输出:[“9001 leetcode.com”,“9001 discuss.leetcode.com”,“9001 com”]
解释:例子中仅包含一个网站域名:“discuss.leetcode.com”。
按照前文描述,子域名 “leetcode.com” 和 “com” 都会被访问,所以它们都被访问了 9001 次。

示例 2:

输入:cpdomains = [“900 google.mail.com”, “50 yahoo.com”, “1 intel.mail.com”, “5 wiki.org”]
输出:[“901 mail.com”,“50 yahoo.com”,“900 google.mail.com”,“5 wiki.org”,“5 org”,“1 intel.mail.com”,“951 com”]
解释:按照前文描述,会访问 “google.mail.com” 900 次,“yahoo.com” 50 次,“intel.mail.com” 1 次,“wiki.org” 5 次。
而对于父域名,会访问 “mail.com” 900 + 1 = 901 次,“com” 900 + 50 + 1 = 951 次,和 “org” 5 次。

提示:
1 <= cpdomain.length <= 100
1 <= cpdomain[i].length <= 100
cpdomain[i] 会遵循 “repi d1i.d2i.d3i” 或 “repi d1i.d2i” 格式
repi 是范围 [1, 104] 内的一个整数
d1i、d2i 和 d3i 由小写英文字母组成

class Solution:
    def subdomainVisits(self, cpdomains):
        """
        :type cpdomains: List[str]
        :rtype: List[str]
        """
        dic = {}
        for s in cpdomains:
            count = int(s.split()[0]) #注意分割后是字符串,要转整形,不然加法会出错
            host = s.split()[-1].split('.')
            for i in range(len(host)):
                temp = '.'.join(host[i:]) #拼接所有域名的可能组合
                if temp in dic.keys():
                    dic[temp] += count #把域名做key,访问次数做value
                else:
                    dic[temp] = count
        res = []
        for key in dic.keys():
            res.append(str(dic[key]) + ' ' + key)  #要转为字符串类型做+运算
        return res