正则表达式(Regular Expressions),又被称为regex或regexp,是一种十分简便、灵活的文本处理工具。它可以用来精确地找出某文本中匹配某种指定规则的内容。

       关于正则表达式的教程,可以参考这里

        在C/C++中常用的正则表达式库有GNU Regex Library, Boost.Regex, PCRE, PCRE++。这四个库中,后面两个是有关系,其它都是各自己独立的,是不同的实现。今天主要用GNU Regex Library。

      

几个主要函数

(1)regcomp:

int regcomp(regex_t *preg, const char *pattern, int cflags) 功能:将要进行匹配的正则表达式pattern进行编译,做匹配前的准备工作 参数: preg, 输出参数,用来保存编译后的正则表达式结果 pattern, 输入参数,传入要进行编译的正则表达式的字符串 cflags, 输入参数,用来指定正则表达式匹配过程中的一些选项 返回值:编译成功返回0,失败返回非0的错误码

(2)regexec:

int regexec(const regex_t *preg, const char *string, size_t nmatch, regmatch_t pmatch[],              int eflags) 功能:用来检测字符串string是否匹配正则表达式preg 参数: preg, 输入参数,在(1)regcomp中编译好的正则表达式规则       string, 输入参数,用来被匹配的字符串       nmatch, 输入参数,用来指定pmatch参数所对应的数组的长度       pmatch, 输出参数,用来输出在string中匹配preg的具体位置       eflag, 输入参数,用来指定正则表达式匹配过程中的一些选项 返回值: 如果string匹配preg所指定的规则,则返回0, 否则返回非0

(3)regerror:

size_t regerror(int errcode, const regex_t *preg, char *errbuf, size_t errbuf_size) 功能:用来把在regcompt和regexec中产生的错误码转化成字符串形式的错误信息 参数: errcode, 输入参数,在regcomp或regexec调用中返回的错误码 preg, 输入参数,与错误码所对应的编译过的正则表达式结构 errbuf, 输出参数,用来返回错误信息的buffer,如果buffer不够所需大小,错误信息将被截断 errbuf_size, 输入参数,返回错误信息的buffer的大小  返回值: 如果errbuf_size为0,那么regerror返回错误信息所需要的buffer的大小

(4)regfree:

void regfree (regex_t *preg) 功能: 用来释放由regcomp编译时生成的preg结构所占用的内存 参数: preg, 输入参数,由regcomp编译时生成的正则表达的结构指针 返回值: 无


实例-邮箱匹配

#include <stdio.h> #include <sys/types.h> #include <regex.h> int main(int argc,char** argv) { 	int status,i; 	int cflags=REG_EXTENDED; 	regmatch_t pmatch[1]; 	const size_t nmatch=1; 	regex_t reg; 	const char *pattern ="^\\w+([-+.]\\w+)*@\\w+([-.]\\w+)*.\\w+([-.]\\w+)*"; 	char buf[256]; 	 	regcomp(®,pattern,cflags); 	while(true) 	{ 		printf("input your email address:\n"); 		gets(buf); 		if((status=regexec(®,buf,nmatch,pmatch,0))==0) 		{ 			printf("Correct\n"); 			//print match part 			for(i=pmatch[0].rm_so;i<pmatch[0].rm_eo;++i) 			putchar(buf[i]); 			printf("\n"); 			regfree(®); 			break; 		} 		else 		{ 			printf("Error address,input again:\n"); 		} 	} 	return 0; 	 }



参考:深入浅出C/C++中的正则表达式库(一)——GNU Regex Library--http://www.wuzesheng.com/?p=929