模式匹配的实现,'?'代表单一字符,'*'代表任意多的字符,写代码实现两个字符串是否匹配。

Implement wildcard pattern matching with support for '?' and '*'.、


'?' Matches any single character.
'*' Matches any sequence of characters (including the empty sequence).

The matching should cover the entire input string (not partial).

The function prototype should be:
bool isMatch(const char *s, const char *p)

Some examples:
isMatch("aa","a") → false
isMatch("aa","aa") → true
isMatch("aaa","aa") → false
isMatch("aa", "*") → true
isMatch("aa", "a*") → true
isMatch("ab", "?*") → true
isMatch("aab", "c*a*b") → false



要注意的就是'*'可以代表任意长度的字符,甚至可以是0个。也就是可以忽略。下面是简单的分析思路:

1)两个辅助指针分别指向模式串和比较字符串,如果当前两个字符相等(可能是'?'),两个指针都加一比较下一个字符。

2)如果比较字符串当前字符是星号,因为星号可能代表0个字符或者多个字符,零个字符就代表比较字符串的下一个字符和模式串的当前字符比较,如果不相等,说明不是代表零个字符,这个时候就要用比较字符串的下一个跟模式串的下一个比较。如果相等说明可能代表零个字符,那么就等于执行了第一步。直到遇到不相等的字符时,说明星号可能代表了较多的字符,而我们只是吃掉了较少的字符,这个时候我们就应该回退到星号的后一个字符,去跟模式串之前标记不相等的位置的后一个去比较。因此,在遇到星号的时候我们应该标记模式串和比较字符串的位置,当遇到不相等的时候模式串的标记后移一位,说明星号多代表了一个字符。

3)最后比较字符串可能还剩下比较多的星号,应为星号可能代表零个字符,一次要忽略掉这些。

4)最后查看比较字符串是否到尾部就说明两个字符串是否匹配。

代码如下:

class Solution {
public:
    bool isMatch(const char *s, const char *p) {
        const char* star = nullptr;
        const char* rs = nullptr;
        
        while(*s) {
            if(*s == *p || *p == '?') { //match
                s++; p++;
                continue;
            }
            if(*p == '*') { 
                star = p; // record star
                p++; //match from next p
                rs = s; // record the position of s , star match 0,从匹配零个字符开始
                continue;
            } 
            if(star != nullptr) { //if have star in front then backtrace
                p = star + 1; //reset the position of p 
                s = rs + 1; 
                rs ++; //star match 1,2,3,4,5....每次都多吃掉一个字符
                continue;
            }
            return false; //if not match return false,能执行到这步说明发生了不匹配
        }
        while(*p == '*') p++; //skip continue star
        return *p == '\0'; // successful match,之前s已到结尾,看p是否遍历完代表是否匹配
    }
};



这与之前的一个例题有相似的地方,但是那里的星号是代表了前缀字符,而这里的星号可能代表任意字符数量。

这里的回退与KMP有相似的地方,两者能否比较融合呢?下次再看到这里的时候要做下比较。