最小编辑距离 python leetcode

原创

mob64ca12e08acf 2025-02-16 03:59:37 ©著作权

文章标签 最小编辑距离数组字符串 文章分类 Python 后端开发

©著作权归作者所有：来自51CTO博客作者mob64ca12e08acf的原创作品，请联系作者获取转载授权，否则将追究法律责任

最小编辑距离算法及其实现

在计算机科学中，“最小编辑距离”指的是将一个字符串转换成另一个字符串所需的最小操作次数。操作可以包括插入、删除或替换字符。这个概念在自然语言处理、拼写检查和DNA序列比对等领域中有着广泛的应用。

问题描述

给定两个字符串 word1 和 word2，需要计算将 word1 转换成 word2 所需要的最小编辑距离。

例如：

输入： word1 = "horse"，word2 = "ros"
输出： 3 （将 “h” 替换为 “r”，将 “e” 删除，最后将 “s” 插入到末尾）

动态规划解决方案

最小编辑距离可以通过动态规划来高效求解。我们可以定义一个二维数组 dp，其中 dp[i][j] 表示将 word1 的前 i 个字符转换为 word2 的前 j 个字符所需的最小操作次数。

状态转移方程

我们可以通过以下方式来填写 dp 数组：

如果 word1[i-1] 等于 word2[j-1]，则 dp[i][j] = dp[i-1][j-1]。
如果不相等，则：
- 插入操作：dp[i][j-1] + 1
- 删除操作：dp[i-1][j] + 1
- 替换操作：dp[i-1][j-1] + 1

因此，状态转移方程为：

dp[i][j] = min(dp[i-1][j] + 1,   # 删除
               dp[i][j-1] + 1,   # 插入
               dp[i-1][j-1] + cost)  # 替换，cost 为 0 或 1

其中 cost 为 0（表示相同）或 1（表示不同）。

Python 实现

下面是完整的 Python 实现代码：

def minDistance(word1: str, word2: str) -> int:
    m, n = len(word1), len(word2)
    dp = [[0] * (n + 1) for _ in range(m + 1)]

    # 初始化 dp 数组
    for i in range(m + 1):
        dp[i][0] = i  # word1 到空字符串的编辑距离
    for j in range(n + 1):
        dp[0][j] = j  # 空字符串到 word2 的编辑距离

    # 填充 dp 数组
    for i in range(1, m + 1):
        for j in range(1, n + 1):
            if word1[i - 1] == word2[j - 1]:
                dp[i][j] = dp[i - 1][j - 1]
            else:
                dp[i][j] = min(dp[i - 1][j] + 1,    # 删除
                               dp[i][j - 1] + 1,    # 插入
                               dp[i - 1][j - 1] + 1)  # 替换

    return dp[m][n]

复杂度分析

时间复杂度：O(m * n)，其中 m 和 n 是两个字符串的长度。
空间复杂度：O(m * n)，需要使用一个二维数组来存储编辑距离。

甘特图

在实现算法的过程中，代码的执行可以用甘特图表示出各个部分的执行时间和任务。下面是一个简化版的甘特图展示：

gantt
    title 最小编辑距离算法
    dateFormat  YYYY-MM-DD
    section 初始化
    初始化 dp 数组       :a1, 2023-10-01, 1d
    section 填充 dp 数组
    填充 dp 数组       :after a1  , 2023-10-02, 3d

在这个图中，输出展示了初始化和填充 dp 数组的时间安排。