概率 dp习题

前言:太菜了,没学这个知识点,来补了,希望不咕咕咕。


1.D. Bag of mice

思路:板子题,求公主赢的概率,状态设为 d p [ i ] [ j ] dp[i][j] dp[i][j]有 i i i只白鼠, j j j只黑鼠,公主先手赢得概率。

首先初始化: d p [ i ] [ 0 ] = 1 , d p [ 0 ] [ j ] = 0 , i ∈ [ 1 , w ] , j ∈ [ 0 , b ] dp[i][0]=1,dp[0][j]=0,i\in[1,w],j\in[0,b] dp[i][0]=1,dp[0][j]=0,i∈[1,w],j∈[0,b]

然后状态转移:

分四种情况:

1.公主摸到白鼠, d p [ i ] [ j ] + = i i + j dp[i][j]+=\dfrac{i}{i+j} dp[i][j]+=i+ji​

2.公主摸到黑鼠,龙摸到白鼠,直接输了,不用加。

3.公主摸到黑鼠,龙摸到黑鼠,且跑出一个黑鼠。

d p [ i ] [ j ] + = j i + j × j − 1 i + j − 1 × j − 2 i + j − 2 × d p [ i ] [ j − 3 ] dp[i][j]+=\dfrac{j}{i+j}\times \dfrac{j-1}{i+j-1} \times \dfrac{j-2}{i+j-2}\times dp[i][j-3] dp[i][j]+=i+jj​×i+j−1j−1​×i+j−2j−2​×dp[i][j−3]

4.公主摸到黑鼠,龙摸到黑鼠,且跑出一个白鼠。

d p [ i ] [ j ] + = j i + j × j − 1 i + j − 1 × i i + j − 2 × d p [ i − 1 ] [ j − 2 ] dp[i][j]+=\dfrac{j}{i+j}\times \dfrac{j-1}{i+j-1} \times \dfrac{i}{i+j-2}\times dp[i-1][j-2] dp[i][j]+=i+jj​×i+j−1j−1​×i+j−2i​×dp[i−1][j−2]

#include<bits/stdc++.h>
using namespace std;
typedef long long ll;
const int N=1e3+5,M=2e4+5,inf=0x3f3f3f3f,mod=1e9+7;
#define mst(a,b) memset(a,b,sizeof a)
#define PII pair<int,int>
#define fi first
#define se second
#define pb push_back
int w,b;
double dp[N][N];
int main(){
scanf("%d%d",&w,&b);
for(int i=0;i<=w;i++) dp[i][0]=1;
for(int i=0;i<=b;i++) dp[0][i]=0;
for(int i=1;i<=w;i++)
for(int j=1;j<=b;j++){
dp[i][j]+=(double)i/(i+j);
if(j>=3){
dp[i][j]+=(double)j/(i+j)*(j-1)/(i+j-1)*(j-2)/(i+j-2)*dp[i][j-3];
}
if(j>=2){
dp[i][j]+=(double)j/(i+j)*(j-1)/(i+j-1)*i/(i+j-2)*dp[i-1][j-2];
}
}
printf("%.9f\n",dp[w][b]);
return 0;
}

2.ICPC模拟赛 D.Pokemon Ultra Sun

题意:两个宝可梦初始血量为 h p 1 , h p 2 hp_1,hp_2 hp1​,hp2​,第一个宝可梦每回合有 p p p的概率对第二个宝可梦造成 w w w伤害,有 ( 1 − p ) (1-p) (1−p)的概率对自己造成 w w w伤害,求回合数的期望。

思路:令 d p [ i ] [ j ] dp[i][j] dp[i][j]表示第一个宝可梦血量为 i i i,第二个宝可梦血量为 j j j的回合数期望。

状态转移方程:

d p [ i ] [ j ] = p × ( d p [ i ] [ m a x ( 0 , j − w ) ] + 1 ) + ( 1 − p ) × ( d p [ m a x ( 0 , i − w ) ] [ j ] + 1 ) = 1 + p × d p [ i ] [ m a x ( 0 , j − w ) ] + ( 1 − p ) × d p [ m a x ( 0 , i − w ) ] [ j ] dp[i][j]\\=p\times (dp[i][max(0,j-w)]+1)+(1-p)\times (dp[max(0,i-w)][j]+1) \\=1+p\times dp[i][max(0,j-w)]+(1-p)\times dp[max(0,i-w)][j] dp[i][j]=p×(dp[i][max(0,j−w)]+1)+(1−p)×(dp[max(0,i−w)][j]+1)=1+p×dp[i][max(0,j−w)]+(1−p)×dp[max(0,i−w)][j]

初始状态: d p [ 0 ] [ 0 ] = d p [ i ] [ 0 ] = d p [ 0 ] [ i ] = 0 dp[0][0]=dp[i][0]=dp[0][i]=0 dp[0][0]=dp[i][0]=dp[0][i]=0。

#include<bits/stdc++.h>
using namespace std;
typedef long long ll;
const int N=3e3+5,M=2e4+5,inf=0x3f3f3f3f,mod=1e9+7;
#define mst(a,b) memset(a,b,sizeof a)
#define PII pair<int,int>
#define fi first
#define se second
#define pb push_back
int T,h1,h2,w;
double p;
double dp[N][N];
int main(){
cin>>T;
while(T--){
cin>>h1>>h2>>w>>p;mst(dp,0);
for(int i=1;i<=h1;i++){
for(int j=1;j<=h2;j++){
dp[i][j]=1.0+p*dp[i][max(0,j-w)]+(1-p)*dp[max(0,i-w)][j];
}
}
printf("%.6f\n",dp[h1][h2]);
}
return 0;
}

3.Crossing Rivers

题意:给定路径长为 D D D的路径 A B AB AB和 n n n条河,每条河左端距离 A A A为 p p p,长度为 L L L,每条河上有船,速度为 v v v,船的方向,位置随机。每条河不会相交且不会越界 A B AB AB,陆地上速度为 1 1 1,求从 A A A到 B B B的时间期望。

跟 d p dp dp没关系,求期望问题,最坏情况是刚到河,船刚开走,时间为: 3 L v \dfrac{3L}{v} v3L,最好情况是刚到河,船刚开来,时间为: L v \dfrac{L}{v} vL

因为船的位置线性的,所以平均下来就是 2 L v \dfrac{2L}{v} v2L​。

然后求和即可,最后加上剩下走陆地的时间,就是总期望。

#include<bits/stdc++.h>
using namespace std;
typedef long long ll;
const int N=1e3+5,M=2e4+5,inf=0x3f3f3f3f,mod=1e9+7;
#define mst(a,b) memset(a,b,sizeof a)
#define PII pair<int,int>
#define fi first
#define se second
#define pb push_back
int n,d;
int main(){
int kase=0;
while(scanf("%d%d",&n,&d)&&(n||d)){
double ans=0;
while(n--){
int p,l;double v;
cin>>p>>l>>v;
ans+=2.0*l/v;
d-=l;
}
ans+=d;
printf("Case %d: %.3f\n\n",++kase,ans);
}
return 0;
}