哈希

Tags:字符串


一、概述

百度百科:
散列表(Hash table/哈希表),是根据关键码值(Key value)而直接进行访问的数据结构。

哈希表常用于比较两个字符串是否相同(可以把状态看作字符串,从而比较状态是否相同)

二、实现方式

一个例子

通常将其看成一个进制数,比如\(ABAF\)看成\(1216\),那么哈希值就是\(Hash=1*base^3+2*base^2+1*base+6\),\(base\)可以自由决定,如果说状态量有限,可以使用较小的\(base\)使得所有状态不冲突,若状态量较大且分散,可以采用取模或者自然溢出的方式尽可能避免冲突

优缺点

优点是可以\(O(1)\)比较(数组是\(O(1)\)如果用map就要加一个\(log\))
缺点是会有冲突,为避免冲突可以选择双哈希或三哈希等(选取不同的模数)

哈希方式

1.进制哈希(用于判断状态/数组是否相同)

\[Hash[i]=Hash[i-1]*base+val[i]$$优点:方便好写    状态量小时哈希过程可逆(见[一双木棋](https://www.luogu.org/problemnew/show/P4363)) 缺点:毒瘤出题人卡自然溢出,采用双哈希    状态量大时哈希过程不可逆(不能通过Hash值还原数组) 使用范围:基本上这么写 >2.树哈希(用于判断树的同构) $$Hash[x]=\sum_{异或和}(Hash[son_{1...k}]+base1)*(siz[x]+base2)+deep[x]*base3$$其实没有一定要求这么写,只是树的同构要求深度相同,孩子也同构但是与孩子的顺序无关,所以信息就是儿子的$Hash$和深度和大小,可以灵活处理 千古神犇陈菊开安利的一种写法:$$Hash[x]=(\sum{Hash[son]})^{size[x]}\]

注意:base的选取原则是使得Hash值尽可能分散,尽可能少的冲突
优点:这里不用累乘而用异或和,使得Hash过程可逆(也就是在树DP中方便换根/删点
缺点:没有固定套路,灵活多变(有次考试不管怎么调\(base\)总是过不了,把异或和改成累乘马上就过了,原因是数据范围小,Hash值密集容易造成冲突)

三、题单

四、代码

// [九省联考2018]一双木棋chess
#include<iostream>
#include<cstdio>
#include<cstdlib>
#include<map>
#define ll long long
using namespace std;
int N,M,A[11][11],B[11][11],b[11];
map<ll,int>Map;
ll HASH()
{
    ll Hash=0;
    for(int i=1;i<=N;i++) Hash=Hash*11+b[i];
    return Hash;
}
void ReHash(ll Hash)
{
    for(int i=N;i>=1;i--) b[i]=Hash%11,Hash/=11;
}
int DFS(int op,ll Hash)
{
    if(Map[Hash]) return Map[Hash]==-1?0:Map[Hash];
    ReHash(Hash);int ans=1e9*(-op);
    for(int i=1;i<=N;i++)
        if(b[i]<b[i-1])
        {
            b[i]++;int tmp=DFS(-op,HASH());
            if(op==1) ans=max(ans,tmp+A[i][b[i]]);
            else ans=min(ans,tmp-B[i][b[i]]);
            b[i]--;
        }
    if(ans==1e9*(-op)) ans=0;
    Map[Hash]=(ans==0?-1:ans);
    return ans;
}
int main()
{
    scanf("%d%d",&N,&M);
    for(int i=1;i<=N;i++)
        for(int j=1;j<=M;j++)
            scanf("%d",&A[i][j]);
    for(int i=1;i<=N;i++)
        for(int j=1;j<=M;j++)
            scanf("%d",&B[i][j]);
    b[0]=M;
    printf("%d\n",DFS(1,0));
    return 0;
}