I.II.[POI2014]HOT-Hotels 加强版
易于发现,三点间两两距离相等,当且仅当两个LCA较深的点到它们的LCA距离相等,且第三个点到该LCA的距离与前两个点相同。
于是我们设 \(f_{x,i}\) 表示 \(x\) 子树中有多少对点,它们到LCA距离相同,且上述距离比该LCA到 \(x\) 的距离长 \(i\)。考虑现在将子树 \(y\) 合并进答案。
则有 \(f_{x,i}\times g_{y,i+1}\rightarrow ans\),\(g_{x,i}\times f_{y,i-1}\rightarrow ans\),\(f_{x,i}\times f_{y,i-1}\rightarrow g_{x,i}\),\(f_{y,i-1}\rightarrow f_{x,i}\),\(g_{y,i+1}\rightarrow g_{x,i}\)。
但是这显然过不去 \(10^5\) 的数据。
但是,因为DP状态与深度有关,就可以考虑长链剖分优化。具体而言,考虑到仅有一个儿子时,直接有 \(f_{y,i-1}\rightarrow f_{x,i}\) ,\(g_{y,i+1}\rightarrow g_{x,i}\),以及一个 \(g_{y,1}\rightarrow ans\),可以直接通过指针之类 \(O(1)\) 转移。则如果我们考虑继承长儿子的答案的话,就会大大优化复杂度。具体优化了多少呢?总复杂度可以被证明是 \(O(n)\) 的。
指针使用时要极其小心,不能调用奇奇怪怪的东西,不能越界,一定要仔细算好范围。
时间复杂度 \(O(n)\)。
代码:
#include<bits/stdc++.h> using namespace std; typedef long long ll; int n,dep[100100],son[100100]; int F[500100],*f[100100],*ff=F; ll G[500100],*g[100100],res,*gg=G; vector<int>v[100100]; void dfs1(int x,int fa){ for(auto y:v[x])if(y!=fa){dfs1(y,x);if(dep[son[x]]<dep[y])son[x]=y;} dep[x]=dep[son[x]]+1; } void init(int x){f[x]=ff,ff+=dep[x]+1,gg+=dep[x]+1,g[x]=gg,gg+=dep[x]+1;} void dfs2(int x,int fa){ if(!f[x])f[x]=ff,ff+=(dep[x]<<1); if(!g[x])gg+=dep[x],g[x]=gg,gg+=dep[x]; if(son[x])f[son[x]]=f[x]+1,g[son[x]]=g[x]-1,dfs2(son[x],x),res+=g[x][0]; f[x][0]=1; for(auto y:v[x])if(y!=fa&&y!=son[x]){ dfs2(y,x); for(int i=1;i<=dep[y];i++)res+=g[y][i]*f[x][i-1]; for(int i=0;i<=dep[y];i++)res+=g[x][i+1]*f[y][i]; for(int i=0;i<=dep[y];i++)g[x][i+1]+=1ll*f[x][i+1]*f[y][i]; for(int i=0;i<dep[y];i++)g[x][i]+=g[y][i+1]; for(int i=0;i<=dep[y];i++)f[x][i+1]+=f[y][i]; } // printf("%d:\n",x);for(int i=0;i<=dep[x];i++)printf("%d %d\n",f[x][i],g[x][i]); } int main(){ scanf("%d",&n); for(int i=1,x,y;i<n;i++)scanf("%d%d",&x,&y),v[x].push_back(y),v[y].push_back(x); dep[0]=-1,dfs1(1,0); // for(int i=1;i<=n;i++)printf("(%d %d)",dep[i],son[i]);puts(""); dfs2(1,0),printf("%lld\n",res); return 0; }