国企年终

今天刷到一个近期帖子:中国建设银行,这年终奖噶噶高!!!!

中国建设银行,这年终奖噶噶高!!!!(含算法原题)_面试

先撇去具体内容不看,能在自然年的 中国建设银行,这年终奖噶噶高!!!!(含算法原题)_复杂度_02

再细看内容,年终奖是一个 中国建设银行,这年终奖噶噶高!!!!(含算法原题)_字符串_03 字头的 中国建设银行,这年终奖噶噶高!!!!(含算法原题)_面试_04

由于国企通常没有类似「互联网动辄 中国建设银行,这年终奖噶噶高!!!!(含算法原题)_面试_05 个月以上作为年终奖」这样的说法,因此这个奖金数即使去掉当月薪资(直接除 中国建设银行,这年终奖噶噶高!!!!(含算法原题)_字符串_06),然后对标互联网的到手月收入,都不算是一个能够被嘲笑的数字。

所以,我有点没看懂评论区:

中国建设银行,这年终奖噶噶高!!!!(含算法原题)_字符串_07

这是花式嘲笑,还是花式羡慕呢?🤣

真的,就简中网这个特有的"调侃"类发言,我都不敢想象用这些数据训练出来的 AI,到底能不能正常理解人类表达的意思。

看到最后,大多都是类似上图的奇怪发言。

只有少数和楼主同是银行员工的网友在认真发言 🤣

中国建设银行,这年终奖噶噶高!!!!(含算法原题)_复杂度_08

中国建设银行,这年终奖噶噶高!!!!(含算法原题)_后端_09

这,这没法评啊这???

...

回归主线。

建设银行的题单没有找到,倒是找到一个农业银行的题单。

中国建设银行,这年终奖噶噶高!!!!(含算法原题)_面试_10

乍一眼看过去,好像没有什么互联网公司的题单重,简单题占比如此重。

那来一道多少沾边的「中国农业银行」面试题。

这也是该公司题单中唯三困难题中的第二道

至于第一道题,我们已经 讲过。是一道很有意思的,用初中知识出成的算法题,当时不少同学直呼「有思路,但无从下手」。

今天一起来看看这第二题又怎么样。

题目描述

平台:LeetCode

题号:44

给定一个字符串 (s) 和一个字符模式 (p) ,实现一个支持 '?' 和 '*' 的通配符匹配。

  • '?' 可以匹配任何单个字符。
  • '*' 可以匹配任意字符串(包括空字符串)。

两个字符串完全匹配才算匹配成功。

说明:

  • s 可能为空,且只包含从 a-z 的小写字母。
  • p 可能为空,且只包含从 a-z 的小写字母,以及字符 ? 和 *

示例 1:

输入:
s = "aa"
p = "a"

输出: false

解释: "a" 无法匹配 "aa" 整个字符串。

示例 2:

输入:
s = "aa"
p = "*"

输出: true

解释: '*' 可以匹配任意字符串。

示例 3:

输入:
s = "cb"
p = "?a"

输出: false

解释: '?' 可以匹配 'c', 但第二个 'a' 无法匹配 'b'。

示例 4:

输入:
s = "adceb"
p = "*a*b"

输出: true

解释: 
第一个 '*' 可以匹配空字符串, 
第二个 '*' 可以匹配字符串 "dce".

示例 5:

输入:
s = "acdcb"
p = "a*c?b"

输出: false

动态规划

整理一下题意,对于字符串 p 而言,有三种字符:

  • 普通字符:需要和 s 中同一位置的字符完全匹配
  • '?':能够匹配 s 中同一位置的任意字符
  • '*':能够匹配任意字符串

所以本题关键是分析当出现 '*' 这种字符时,是匹配 0 个字符、还是 1 个字符、还是 2 个字符 ...

本题可以使用动态规划进行求解:

  • 状态定义:f(i,j) 代表考虑 s 中以 i 为结尾的子串和 p 中的 j 为结尾的子串是否匹配。即最终我们要求的结果为 f[n][m]
  • 状态转移:也就是我们要考虑 f(i,j) 如何求得,前面说到了 p 有三种字符,所以这里的状态转移也要分三种情况讨论:
  1. p[j] 为普通字符:匹配的条件是前面的字符匹配,同时 s 中的第 i 个字符和 p 中的第 j 位相同。 即 f(i,j) = f(i - 1, j - 1) && s[i] == p[j]
  2. p[j]'.':匹配的条件是前面的字符匹配,s 中的第 i 个字符可以是任意字符。即 f(i,j) = f(i - 1, j - 1) && p[j] == '.'
  3. p[j]'*':可匹配任意长度的字符,可以匹配 0 个字符、匹配 1 个字符、匹配 2 个字符
    3.1. 当匹配为 0 个:f(i,j) = f(i, j - 1)3.2. 当匹配为 1 个:f(i,j) = f(i - 1, j - 1)3.3. 当匹配为 2 个:f(i,j) = f(i - 2, j - 1)...
    3.k. 当匹配为 k 个:f(i,j) = f(i - k, j - 1)

因此对于 p[j] = '*' 的情况,想要 f(i, j) = true,只需要其中一种情况为 true 即可。也就是状态之间是「或」的关系:

中国建设银行,这年终奖噶噶高!!!!(含算法原题)_复杂度_11

这意味着我们要对 k 种情况进行枚举检查吗?

其实并不用,对于这类问题,我们通常可以通过「代数」进简化,将 i - 1 代入上述的式子:

中国建设银行,这年终奖噶噶高!!!!(含算法原题)_字符串_12

可以发现,f[i - 1][j]f[i][j] 中的 f[i][j - 1] 开始的后半部分是一样的,因此有:

中国建设银行,这年终奖噶噶高!!!!(含算法原题)_面试_13

PS. 其实类似的推导,我在 10. 正则表达式匹配 也做过,第 10 题的推导过程还涉及等差概念,我十分推荐你去回顾一下。如果你能搞懂第 10 题整个过程,这题其实就是小 Case。

编码细节:

  1. 通过上述的推导过程,你会发现设计不少的「回退检查」操作(即遍历到 i 位,要回头检查 i - 1 等),因此我们可以将「哨兵技巧」应用到本题,往两个字符串的头部插入哨兵
  2. 对于 p[j] = '.'p[j] = 普通字符 的情况,想要为 true,其实有共同的条件 f[i - 1][j - 1] == true,因此可以合到一起来做

Java 代码:

class Solution {
    public boolean isMatch(String s, String p) {
        int n = s.length(), m = p.length();
        // 技巧:往原字符头部插入空格,这样得到 char 数组是从 1 开始,而且可以使得 f[0][0] = true,可以将 true 这个结果滚动下去
        s = " " + s; p = " " + p;
        char[] ss = s.toCharArray(), pp = p.toCharArray();
        // f(i,j) 代表考虑 s 中的 1~i 字符和 p 中的 1~j 字符 是否匹配
        boolean[][] f = new boolean[n + 1][m + 1];
        f[0][0] = true;
        for (int i = 0; i <= n; i++) {
            for (int j = 1; j <= m; j++) {
                if (pp[j] == '*') {
                    f[i][j] = f[i][j - 1] || (i - 1 >= 0 && f[i - 1][j]);
                } else {
                    f[i][j] = i - 1 >= 0 && f[i - 1][j - 1] && (ss[i] == pp[j] || pp[j] == '?');
                }
            }
        }
        return f[n][m];
    }
}

C++ 代码:

class Solution {
public:
    bool isMatch(string s, string p) {
        int n = s.length(), m = p.length();
        s = " " + s; p = " " + p;
        vector<vector<bool>> f(n + 1, vector<bool>(m + 1, false));
        f[0][0] = true;
        for (int i = 0; i <= n; i++) {
            for (int j = 1; j <= m; j++) {
                if (p[j] == '*') {
                    f[i][j] = f[i][j - 1] || (i - 1 >= 0 && f[i - 1][j]);
                } else {
                    f[i][j] = i - 1 >= 0 && f[i - 1][j - 1] && (s[i] == p[j] || p[j] == '?');
                }
            }
        }
        return f[n][m];
    }
};

Python 代码:

class Solution:
    def isMatch(self, s: str, p: str) -> bool:
        n, m = len(s), len(p)
        s = " " + s
        p = " " + p
        f = [[False] * (m + 1) for _ in range(n + 1)]
        f[0][0] = True
        for i in range(n + 1):
            for j in range(1, m + 1):
                if p[j] == '*':
                    f[i][j] = f[i][j - 1] or (i - 1 >= 0 and f[i - 1][j])
                else:
                    f[i][j] = i - 1 >= 0 and f[i - 1][j - 1] and (s[i] == p[j] or p[j] == '?')
        return f[n][m]

TypeScript 代码:

function isMatch(s: string, p: string): boolean {
    const n = s.length, m = p.length;
    s = " " + s;
    p = " " + p;
    const f = new Array(n + 1).fill(false).map(() => new Array(m + 1).fill(false));
    f[0][0] = true;
    for (let i = 0; i <= n; i++) {
        for (let j = 1; j <= m; j++) {
            if (p[j] === '*') {
                f[i][j] = f[i][j - 1] || (i - 1 >= 0 && f[i - 1][j]);
            } else {
                f[i][j] = i - 1 >= 0 && f[i - 1][j - 1] && (s[i] === p[j] || p[j] === '?');
            }
        }
    }
    return f[n][m];
};
  • 时间复杂度:n 表示 s 的长度,m 表示 p 的长度,总共 中国建设银行,这年终奖噶噶高!!!!(含算法原题)_复杂度_14 个状态。复杂度为 中国建设银行,这年终奖噶噶高!!!!(含算法原题)_字符串_15
  • 空间复杂度:使用了二维数组记录结果。复杂度为 中国建设银行,这年终奖噶噶高!!!!(含算法原题)_字符串_15

再次强调,动态规划本质上是枚举(不重复的暴力枚举),因此其复杂度很好分析,有多少个状态就要被计算多少次,复杂度就为多少。

我是宫水三叶,每天都会分享算法题解,并和大家聊聊近期的所见所闻。

欢迎关注,明天见。