strtok简介

下面的说明摘自于最新的Linux内核2.6.29,说明了strtok()这个函数已经不再使用,由速度更快的strsep()代替。

函数说明

char *strtok(char s[], const char *delim);

strtok()用来将字符串分割成一个个片段。参数s指向欲分割的字符串,参数delim则为分割字符串中包含的所有字符。当strtok()在参数s的字符串中发现参数delim中包涵的分割字符时,则会将该字符改为\0 字符。在第一次调用时,strtok()必需给予参数s字符串,往后的调用则将参数s设置成NULL。每次调用成功则返回指向被分割出片段的指针。

从s开头开始的一个个被分割的串。当没有被分割的串时则返回NULL。

所有delim中包含的字符都会被滤掉,并将被滤掉的地方设为一处分割的节点。

注意点:

strtok函数会破坏被分解字符串的完整,调用前和调用后的s已经不一样了。如果要保持原字符串的完整,可以使用strchr和sscanf的组合等。

strtok是一个线程不安全的函数,因为它使用了静态分配的空间来存储被分割的字符串位置。

线程安全的函数叫strtok_r。

运用strtok来判断ip或者mac的时候务必要先用其他的方法判断'.'或':'的个数,因为用strtok截断的话,比如:"192..168.0...8..."这个字符串,strtok只会截取四次,中间的...无论多少都会被当作一个key。

1. strtok介绍

众所周知,strtok可以根据用户所提供的分割符(同时分隔符也可以为复数比如“,.”)将一段字符串分割直到遇到"\0"。

比如,分隔符=“,” 字符串=“Fred,John,Ann”

通过strtok 就可以把3个字符串 “Fred”      “John”       “Ann”提取出来。

示例1:

int in=0;

char buffer[]="Fred,John,Ann"

char *p[3];

char *buff = buffer;

while((p[in]=strtok(buf,","))!=NULL)

{

i++;

buf=NULL;

}

如上代码,第一次执行strtok需要以目标字符串的地址为第一参数(buf=buffer),之后strtok需要以NULL为第一参数 (buf=NULL)。指针列p[],则储存了分割后的结果,p[0]="John",p[1]="John",p[2]="Ann",而buf就变 成Fred\0John\0Ann\0。

2. strtok的弱点

strtok在执行过程中,会修改原有字符串,同时由于strtok的实现中有静态变量,是不可重入的。

而且由于strtok的实现基理,在使用strtok的时候,必须以上述示例中的范式来进行,而不能写作如下:

while(p = strtok(test2, ","))来进行。

strtok_r为其可重入版本。

当使用char *test2 = "feng,ke,wei"作为第一个参数传入时,由于test2指向的内容保存在文字常量区,该区的内容是不能修改的,所以会出现内存错误。而char test1[] = "feng,ke,wei" 中的test1指向的内容是保存在栈区的,所以可以修改。

示例2:

#include <iostream>

#include <cstring>

using namespace std;

int main()

{

char sentence[]="This is a sentence with 7 tokens";

cout<<"The string to be tokenized is:\n"<<sentence<<"\n\nThe tokens are:\n\n";

char *tokenPtr=strtok(sentence," ");

while(tokenPtr!=NULL)

{

cout<<tokenPtr<<'\n';

tokenPtr=strtok(NULL," ");

}

//cout<<"After strtok, sentence = "<<tokenPtr<<endl;

return 0;

}