今天看到了一篇好的文章,然后整理了一些问题。现在才感觉到str库yyds。


正文开始

字符串是一种非常重要的数据类型,但是C语言不存在显式的字符串类型,C语言中的字符串都以字符串常量的形式出现或存储在字符数组中。同时,C 语言提供了一系列库函数来对操作字符串,这些库函数都包含在头文件 string.h 中。

一、字符串常量和字符数组

1.1、什么是字符串常量


C 语言虽然没有字符串类型,但是 C语言提是存在字符串这个概念的,也就是字符串常量:以 NUL 字节结尾的 0 个或多个字符组成的序列。字符串常量是不可被修改的,一般用一对双引号(" ")括起的一串字符来表示字符串常量,如:


"Hello!"、"\aWarning!\a"、"123abc\n"、""


字符串常量可以为空,如""就是一个空的字符串常量,但是即使为空,还是存在一个终止符 NUL 的。(在 C 语言中,常用转义字符 \0 来表示 NUL)

1.2、字符串常量与指针


字符串常量与指针关系密切,因为字符串常量的值,实际上表示的是存储这些字符的内存空间的地址,更准确地说是字符串常量中第 1 个字符的地址,而不是这些字符本身。因此,在 C 语言中是不能直接进行字符串赋值的(因为没有字符串类型嘛)。在 C 语言中,常通过声明一个指向 char 类型的指针并将其初始化为一个字符串常量的方式来访问一个字符串:


char *message = "Hello World!";

// 上面的语句也可以拆分成下面两句
char *message;
message = "Hello World!";    // 这句话看起来像是字符串复制,其实不是,只是涉及到指针操作


上述语句声明了一个指向 char 类型的指针,并用字符串常量中第 1 个字符的地址对该指针进行初始化。可以通过字符指针 message 来访问字符串常量:


#include <stdio.h>

int main()
{
  char *message = "Hello World!";
  printf("%s\n",message);
  while(*message != '\0'){
    printf("%c ",*message++);
  }
  printf("\n");
  return 0;
}

/* output:
* Hello World!
* H e l l o W o r l d !
*/


这段代码,使用字符指针遍历了字符串常量中的每一个字符。

1.3、字符数组


用于存放字符的数组称为字符数组。在 C 语言中,除了字符串常量外,其他所有字符串都必须存储于字符数组或动态分配的内存中。定义一个字符数组和定义一个普通数组一样,不同的是字符数组中存放的是字符数据而已:


char charArray[] = {'H','e','l','l','o'};    // 声明并初始化一个字符数组

这句话定义并初始化了一个字符数组 charArray。这个数组的长度实际上为 6 ,因为会自动添加一个字符串结束符 '\0'。


C 语言提供了一种更简洁的方法来对字符数组进行初始化:


char charArray[] = "Hello World!";    // 声明并初始化一个字符数组


上述两种声明方式等价。


可以对一个字符数组做出修改:


#include <stdio.h>
#include <string.h>

int main()
{
char str[] = "hello world!";
int len = strlen(str);
int i;
for(i = 0; i < len; i++){
if( str[i] <= 'z' && str[i] >= 'a'){
str[i] = str[i] - 32;
}
}
printf("%s\n",str);
}


这段代码可以将字符数组中的小写字母转换成大写字母后输出。

1.4、 字符串常量与字符数组的区别


1)字符串常量是一个字符数组,但是内容和长度在初始化时就已经固定了,不可更改;可以通过一个指向字符串常量第一个元素的指针来访问该字符串常量;

2)字符数组是一个用于存放字符的数组,字符数组的值是可以更改的。

二、获取字符串长度

字符串的长度就是这个字符串所包含字符的个数,但是这个长度是不包含 NUL 字符的。C 语言中使用库函数 strlen 来计算字符串长度:


size_t strlen(char const *string);

需要注意的是 strlen 的返回值类型:size_t 类型,这是一个无符号整数类型。


#include <stdio.h>
#include <stdlib.h>
#include <string.h>

int main()
{
char str1[] = "Hello World!";
printf("%d\n",strlen(str1));

return 0;
}

/* output:
* 12
*/

三、复制字符串

C 语言中使用库函数 strcpy 来进行字符串复制操作:


char *strcpy(char *dst , char const *src);


函数 strcpy 接收两个字符串参数,并将参数 src 字符串复制到 dst 参数。使用 strcpy 函数时需要注意的是,必须保证目标字符数组 dst 的长度足够存放源字符数组 src 的内容。如果 src 比 dst 长,则 src 剩余部分的字符仍会被复制,而且它们会覆盖 dst 后面的内存空间的值,如果这除内存空间原本就存放有值,则会导致原本的数据丢失,这样会造成很严重的后果。为了解决这个问题, C 语言中提供了一种更为安全的方式来进行字符串复制操作——strncpy 函数:


char *strncpy(char *dst , char const *src , size_t len);

strncpy 函数有三个参数,与 strcpy 函数一样,它也是将 src 字符串中的字符复制到目标数组 dst 中去,但是 strncpy 函数提供的第三个参数 len 规定了可以向 dst 中写入的字符的个数:


1)如果 strlen(src) > len,则只有 len 个字符被复制到 dst 中去,此时 dst 将不会以 NUL 字节结尾(也就是说,strncpy 调用的结果可能不是一个字符串);

2)如果 strlen(src) < len,则 src 中的字符全被复制到 dst 中去,dst 中剩余的部分用 NUL 填充。

四、连接字符串

C 语言中使用库函数 strcat 来连接两个字符串:


char *strcat(char *dst,char const *src);


函数 strcat 将参数 src 字符串连接到参数 dst 字符串的后面。与 strcpy 函数一个同样的问题是,必须保证 dst 的剩余空间足够存放下 src 整个字符串。C 语言中提供了 strncat 函数来解决这个问题:


char *strncat(char *dst , char const *src , size_t len);

strncat 函数从 src 中最多复制 len 个字符到目标数组 dst 后面,并且,strncat 总是在结果字符串后面添加一个 NUL 字节,而且不会像 strncpy 函数那样对 dst 剩余的空间用 NUL 进行填充。

五、字符串比较

C 语言中使用库函数 strcmp 来进行字符串比较。strcmp 函数会对被比较的两个字符串进行逐字符地比较,直到发现不匹配为止:最先不匹配的字符中较小的那个字符所对应的字符串即被认为小于另一个字符串;如果两者所有字符都匹配,则认为这两个字符串相等;


int strcmp(char const *s1 , char sonst *s2);


该函数的返回值如下:


  1. 1)s1 小于 s2,返回一个负值;

2)s1 等于 s2,返回 0;

3)s1 大于 s2,返回一个正值。


char *strncmp(char const *s1 , char const *s2 , size_t len);


可以使用 strncmp 函数限定比较的字符的个数,返回值与 strcmp 一样,但是只针对前 len 个字符进行比较。

六、字符串的查找

6.1 查找一个字符


可以使用 strchr 函数或 strrchr 函数来在一个字符串中查找一个特定的字符:


char *strchr(char const *str,int ch);    // int ch 是字符的ASCII码值
char *strrchr(char const *str,int ch);


函数 strchr 在字符串 str 中查找字符 ch 第一次出现的位置,并返回一个指向该位置的指针;如果没有找到相应的字符,则返回一个 NULL 指针。函数 strrchr 在字符串中查找字符 ch 最后一次出现的位置,并返回指向该位置的指针。

6.2 查找任意几个字符


可以使用 strpbrk 函数来查找任何一组字符第一次在字符串中出现的位置:


char *strpbrk(char const *str , char const *group);


这个函数返回一个指向字符串 str 中第一个匹配 group 中任何一个字符的字符位置,如果没有匹配到,则返回一个 NULL 指针。

6.3 查找一个子串


可以使用 strstr 函数来在一个字符串中查找一个子串:


char *strstr(char const *str1 , char const *str2);


这个函数在 str1 中查找整个字符串 str2 第一次出现的起始位置,并返回一个指向该位置的指针;如果 str2 并没有完整的出现在 str1 中,则函数将返回一个 NULL 指针;如果 str2 是一个空字符串,则返回str1.

七、文章转自

​https://zhuanlan.zhihu.com/p/65737134#:~:text=C%20%E8%AF%AD%E8%A8%80%E8%99%BD%E7%84%B6%E6%B2%A1%E6%9C%89%E5%AD%97%E7%AC%A6%E4%B8%B2%E7%B1%BB%E5%9E%8B%EF%BC%8C%E4%BD%86%E6%98%AF%20C%E8%AF%AD%E8%A8%80%E6%8F%90%E6%98%AF%E5%AD%98%E5%9C%A8%E5%AD%97%E7%AC%A6%E4%B8%B2%E8%BF%99%E4%B8%AA%E6%A6%82%E5%BF%B5%E7%9A%84%EF%BC%8C%E4%B9%9F%E5%B0%B1%E6%98%AF%E5%AD%97%E7%AC%A6%E4%B8%B2%E5%B8%B8%E9%87%8F%EF%BC%9A%E4%BB%A5%20NUL%20%E5%AD%97%E8%8A%82%E7%BB%93%E5%B0%BE%E7%9A%84%200%20%E4%B8%AA%E6%88%96%E5%A4%9A%E4%B8%AA%E5%AD%97%E7%AC%A6%E7%BB%84%E6%88%90%E7%9A%84%E5%BA%8F%E5%88%97%E3%80%82.%20%E5%AD%97%E7%AC%A6%E4%B8%B2%E5%B8%B8%E9%87%8F%E6%98%AF%E4%B8%8D%E5%8F%AF%E8%A2%AB%E4%BF%AE%E6%94%B9%E7%9A%84%EF%BC%8C%E4%B8%80%E8%88%AC%E7%94%A8%E4%B8%80%E5%AF%B9%E5%8F%8C%E5%BC%95%E5%8F%B7,NUL%20%E7%9A%84%E3%80%82.%20%EF%BC%88%E5%9C%A8%20C%20%E8%AF%AD%E8%A8%80%E4%B8%AD%EF%BC%8C%E5%B8%B8%E7%94%A8%E8%BD%AC%E4%B9%89%E5%AD%97%E7%AC%A6%20%5C0%20%E6%9D%A5%E8%A1%A8%E7%A4%BA%20NUL%EF%BC%89.​


八、测试代码

当然这并没有完,这篇文章有点小bug。我自己手写了个测试str函数的程序,发现的问题写在下面的代码里面,有兴趣的可以复制了去跑一下。代码如下

#include <stdio.h>
#include <stdlib.h>//用system(“pause”)
#include <string.h>//
//本项目用来记录str系列函数的用法
int main()
{
//发现问题
//1.strcpy不接受三个参数(复制)
//2.strcmp不允许三个参数(比较)
//3.strcat不接受三个参数(添加)
//------------------------------------------------------------------
//(长度)strlen()的测试
//char a[]={"1"};
//对于初始没有给定长度
//printf("%d\n",sizeof(char));//输出1
//printf("%d\n",sizeof(a));//在不算'\0',有几个字符输出几,因为字符长度一个为1
//sizeof如果是字符数组''这样的,在末尾不会加上'\0',对a[]={'1'}输出1
//sizeof如果是字符数组“”这样的,会在末尾加上'\0',对a[]+{"1"}输出2
//char a[5]={"10"};
//对于初始给定长度
//printf("%d\n",sizeof(char));//输出1
//printf("%d\n",sizeof(a));//sizeof输出所给定的长度
//printf("%d",strlen(a));
//strlen对字符数组算长度时不计算'\0';
//-------------------------------------------------------------------------
//(复制)strcpy()的测试
//不初始化长度
//char a[]={"hello world"};
//char b[]={"微笑yyds"};
//char c[]={"yyds"};
//strcpy(a,b);//把b字符串赋值给a
//printf("%s\n",a);//结果输出 微笑yyds 正确
//printf("%c",a[7]);有输出的
//printf("%s",a);//结构输出 微笑yyds 正确
//结论:strcpy是根据b有几位(包括'\0')然后把a前几位拷贝成b的值('\0'也会拷贝到a)
//但是a后几位并没有变化
//假如说strcpy(a,c);
//a中的内容是{'y','y','d','s','\0',' ','w','o','r','l','d','\0'};
// 下标 0 1 2 3 4 5 6 7 8 9 10 11
////下标11的'\0'是因为用""声明字符串自动补充的
//但是用strlen读长度或者输出a这个字符串时后面的world并不会干扰
//因为strcpy在前面复制了一个'\0';
//如果b比a长则会出现错误
//char a[20]={"hello world"};
//char b[20]={"微笑yyds"};
//char b[20]={"dxtmkyydsdwqdwqdqwd"};//定义长度20只能存储19个数,因为""会自动末尾补'\0';
//strcpy(a,b,2);//不允许三个参数
//strcpy(a,b);
//printf("%s",a);//如果b的长度大于a的长度小于20依旧不会报错
//char a[11]={"hello word"};
//char b[20]={"微笑yydsdqwnodw"};
//strcpy(a,b);
//printf("%s",a);//b的长度大于a的11,结果报错
//-------------------------------------------------------------------------
//(添加)strcat()的测试
//char a[]={"hello"};1
//char b[]={"w"};2
//strcat(a,b);3
////printf("%d",sizeof(a));测试用
//printf("%s",a);4//代码1,2,3,4跑的时候报错了,为什么?
//因为对a没有初始化长度,默认hello五个位又由于是""会自动加'\0';
//所以说是6位,用sizeof输出也是6位
//这时对a进行添加会变成hellow,然后再自动补一个'0'字符,所以说有七个字符,也就是
//7位,此时已经超过a的长度了,所以说报错
//char a[20]={"hello"};
//char b[20]={"world"};
////strcat(a,b,3);strcat无法接受三个参数
//printf("%s",a);
//运行结果正常,因为加起来还没有超过20
/*char a[8]={"hello"};
char b[20]={"world"};
strcat(a,b);
printf("%s",a);*/
//运行出错,因为加起来溢出了
//-------------------------------------------------------------------------
//(比较)strcmp()测试
//char a[]={"hello"};
//char b[]={"hello"};
//printf("%d",strcmp(a,b.2));运行出错,strcmp不允许三个参数
//printf("%d",strcmp(a,b));//输出0,运作正确
//-------------------------------------------------------------------------
//(单个查找)strchr/strrchr()测试
//char a[]={"hello"};
//char* p;//定义一个指向字符的指针变量
//假设能找到
/*p=strchr(a,101);
printf("%c",*(p));
printf("%c",*(--p));//可以通过地址的加减来控制输出的数据*/
//假设不能找到
//p=strchr(a,65);
//printf("%c",*p);//会报错
//printf("%d",*p);//会报错
//printf("%d",p);//输出0;因为此时返回一个NULL指针
//也就是说判断是否找到就用p是否等于0来写
//strrchr()同理
//-----------------------------------------------------------------------
//(任意查找字符)strpbrk()测试
/*char a[]={"hello"};
char b[]={"pacas"};
char* p;
p=strpbrk(a,b);*/
//printf("%c",*--p);依旧是可以通过加减改变指针指向的位置
//printf("%d",p);找不到输出0;同理strchr/strrchr
//-----------------------------------------------------------------------
//(查找字符串)strstr()测试
//char a[]={"hello world"};
//char b[]={"hello"};
//char* p;
//p=strstr(a,b);
//printf("%s",p);//输出hello world
//为什么呢,因为通过查询字符串找到hello,而hello的首字母h的存储地址正好是a的地址(
//字符数组地址等于第一个字符的地址),也就等于指针指向a中的h,然后%s输出一个字符串,又
//因为d后面才有'\0'终止符,所以说输出hello world
//printf("%s",p);//如果b[]={"helo"},则输出(null);
//--------------------------------------------------------------------------
system("pause");
return 0;
}