数据结构与算法之串的朴素模式匹配

  • ​​前提条件​​
  • ​​简介​​
  • ​​朴素模式匹配算法​​
  • ​​完整代码​​
  • ​​输出结果​​

前提条件

  • 熟悉C语言与指针
  • 熟悉数据结构与算法

简介

  • 串的模式匹配也称为子串的定位操作。设有主串S和子串T,如果在主串S中找到一个与子串T相等的子串,则返回串T的第一个字符在串S中的位置。其中S称为目标串,子串T又称为模式串。
  • 朴素模式匹配的基本思想是:从主串S=“S(0) S1 …S(n-1)”的第pos个字符开始与子串T=“T(0) T1 …T(n-1)”的第一个字符比较,如果相等则继续比较后一个字符;否则从主串的下一字符开始与子串T的第一个字符重新开始比较,以此类推。如果在主串S中存在与子串T相等的连续字符序列,则匹配成功,函数返回子串T中第一个字符在主串S中的位置;否则,函数返回-1。
  • 简单的说,就是对主串的每一个字符作为子串的开头,与要匹配的字符串进行匹配。对主串做大循环,每个字符开头做T的长度的小循环,直到匹配成功或全部遍历完成为止。
  • 朴素模式匹配算法简单、易于理解,但是执行效率不高。在此算法中,即使主串与子串已有多个字符经过比较且相等,但只要有一个字符不相等,就需要将主串的比较位置退回。
  • 例如,假设主串S=“ababc”,子串T=“abc”。其中数据结构与算法之串的朴素模式匹配_模式匹配。每次比较子串的最后一个字符与主串中的字符不相等,所以均需将主串的指针退回,从主串的下一个字符开始与子串的第一个字符重新比较。在整个匹配过程中,主串的指针需要退回2次,匹配不成功的比较次数数据结构与算法之串的朴素模式匹配_字符串_02,成功匹配的比较次数3次,总的比较次数为数据结构与算法之串的朴素模式匹配_字符串_03 ,即数据结构与算法之串的朴素模式匹配_模式匹配_04.
  • 设主串的长度为n,子串的长度为m。朴素模式匹配算法在最好的情况下,即主串的前m个字符刚好与子串相等,时间复杂度数据结构与算法之串的朴素模式匹配_模式匹配_05。在最坏的情况下,朴素模式匹配算法的时间复杂度数据结构与算法之串的朴素模式匹配_字符串_06
  • 如图所示。

朴素模式匹配算法

int Index(char S[],char T[],int pos)
/*查找并返回模式串T在主串S中从pos开始的位置(下标),若T不是S的子串,则返回-1*/
{
int i=pos,j=0;/*i,j分别用于指出主串字符和模式串字符的位置(下标)*/
int slen=strlen(S);/*S串长*/
int tlen=strlen(T);/*T串长*/
while (i<slen&&j<tlen)
{
if(S[i]==T[j])
{
i++;
j++;
}
else
{
i=i-j+1;
j=0;
}
}
if(j>=tlen)
{
return i-tlen;
}
return -1;
}

完整代码

#include<stdio.h>
#include<stdlib.h>

int Index(char S[],char T[],int pos)
/*查找并返回模式串T在主串S中从pos开始的位置(下标),若T不是S的子串,则返回-1*/
{
int i=pos,j=0;/*i,j分别用于指出主串字符和模式串字符的位置(下标)*/
int slen=strlen(S);/*S串长*/
int tlen=strlen(T);/*T串长*/
while (i<slen&&j<tlen)
{
if(S[i]==T[j])
{
i++;
j++;
}
else
{
i=i-j+1;
j=0;
}
}
if(j>=tlen)
{
return i-tlen;
}
return -1;
}

int main(){
char S[]="ababc";
char T[]="abc";
int loc;
loc=Index(S,T,0);
printf("start_loc:%d\n",loc);
system("pause");
return 0;
}

输出结果

数据结构与算法之串的朴素模式匹配_模式匹配_07