给定两个字符串 A和 B,现在要将 A经过若干操作变为 B,可进行的操作有:
- 删除–将字符串 A中的某个字符删除。
- 插入–在字符串 A的某个位置插入某个字符。
- 替换–将字符串 A中的某个字符替换为另一个字符。
现在请你求出,将 A变为 B 至少需要进行多少次操作。
输入格式
第一行包含整数 n,表示字符串 A 的长度。
第二行包含一个长度为 n 的字符串 A。
第三行包含整数 m,表示字符串 B 的长度。
第四行包含一个长度为 m 的字符串 B。
字符串中均只包含大小写字母。
输出格式
输出一个整数,表示最少操作次数。
数据范围
1≤n,m≤1000
输入样例:
10
AGTCTGACGC
11
AGTAAGTAGGC
输出样例:
4
初次看到这种题目可能确实会懵逼,这些操作太具有随机性了,每次操作后去比较字符串是否相同也不太实际。
如果采用dfs暴搜,时间复杂度高的离谱。
将A串变为B串,从头往后比较和从随意地方开始比较,最终需要操作的最小次数是否相同?或者换句话来说,最小操作次数跟操作的顺序有关吗?
这个有待证明,主观上我认为是无关的。
好吧,不扯了。
我们假设上述是成立的。
将A串经过若干操作修改成B串,我们选定增删替换只操作A串,且从头往后进行操作的方式。
设置一个二位数组
f[i][j] 表示将A串前i个字母修改成B串的所有操作方式,其属性为其中的最小操作次数。
那么如何得到f[i][j]呢?
我们假设最后一下通过删除A串中的某个字符然后二者相等了。
这个前提是A串的i-1个字符与B串的j个字符相等。即a[1~i-1]==b[1~j]。
那么f[i][j]=f[i-1][j]+1;
同理如果最后一下通过在A串中插入某个字符,然后二者相等。
这个前提就是a[1~i]==b[1~j-1]。
那么f[i][j]=f[i][j-1]+1;
如果最后一下是通过替换
前提就是a[1~i-1]==b[1~i-1]
f[i][j]=f[i-1][j-1]。
当然还有一种a[i]==b[j]的情况,不需要操作。
f[i][j]=f[i-1][j-1]。
在上述情况中取min,f[i][j]就储存了最短编辑距离。
从小状态递推到大状态,上述的四个递推式,也就是状态转移方程。
当然写DP题目一般还得考虑边界问题,即初始化操作。
有一些边界状态是不需要递推得出的。
即f[1~n][0] f[0][1~m]
代码:
#include<iostream>
using namespace std;
const int N=1010;
char a[N],b[N];
int f[N][N];
int n,m;
int main()
{
cin>>n;
for(int i=1;i<=n;i++)cin>>a[i];
cin>>m;
for(int i=1;i<=m;i++)cin>>b[i];
//初始化边界
for(int i=1;i<=n;i++)f[i][0]=i;
for(int i=1;i<=m;i++)f[0][i]=i;
for(int i=1;i<=n;i++)
{
for(int j=1;j<=m;j++)
{
f[i][j]= min(f[i-1][j]+1,f[i][j-1]+1);
if(a[i]==b[j])f[i][j]=min(f[i][j],f[i-1][j-1]);
else
f[i][j]=min(f[i][j],f[i-1][j-1]+1);
}
}
cout<<f[n][m];
return 0;
}