串
子串:串中任意个连续的字符组成的子序列
主串:包含子串的串
字符在主串中的位置:字符在串中的序号
子串在主串中的位置:子串的第一个字符在主串中的位置
串是一种特殊的线性表,数据元素之间呈线性关系
串的数据对象限定为字符集(如中文字符、英文字符、数字字符、标点字符等)
串的基本操作,如增删改查等通常以子串为操作对象
串的基本操作
StrAssign(&T,chars):赋值操作。把串T赋值为chars
StrCopy(&T,S):复杂操作。由串S复制得到串T
StrEmpty(S):判空操作。若S为空串,则返回TRUE,否则返回FALSE
StrLength(S):求串长。返回串S的元素个数
ClearString(&S):清空操作。将S清为空串
DestroyString(&S):销毁串。将串S销毁(回收存储空间)
Concat(&T,S1,S2):串连接。用T返回由S1和S2连接而成的新串
SubString(&Sub,S,pos,len):求子串。用Sub返回串S的第pos个字符起长度为len的子串
Index(S,T):定位操作。若主串S中存在与串T值相同的子串,则返回它在主串S中第一次出现的位置;否则函数值为0。
StrCompare(S,T):比较操作。若S>T,则返回值>0;若S=T,则返回值=0;若S<T,则返回值<0。
串的存储结构
动态
串的链式存储
基本操作的实现
SubString(&Sub,S,pos,len):求子串。用Sub返回串S的第pos个字符起长度为len的子串
StrCompare(S,T):比较操作。若S>T,则返回值>0;若S=T,则返回值=0;若S<T,则返回值<0。
Index(S,T):定位操作。若主串S中存在与串T值相同的子串,则返回它在主串S中第一次出现的位置;否则函数值为0。
朴素模式匹配算法
将主串中所有长度为m的子串依次与模式串对比,直到找到一个完全匹配的子串,或所有的子串都不匹配为止
KMP算法
求next数组
其他next:在不匹配的位置前,划一根分界线模式串一步一步往后退,直到分界线之前“能对上”,或模式串完全跨过分界线为止。此时j指向哪儿,next数组值就是多少
KMP算法优化
求nextval数组
先求next数组,再由next数组求nextval数组
模式串T=aaab
next[j] = [0,1,2,3,4]
nextval[j] = [0,0,0,0,4]