string functions are used and parsed(字符串函数的使用和剖析)
求子符传长度 :
strlen
长度不受限制的字符串函数:
strcmp(a1,a2)(比较两字符串是否相等,相等返回 0,a1长于a2,返回正数,a1小于a2,返回负数)
strcpy(a1.a2)把a2字符串内容 赋给 a1(要保证a1,要有足够大的空间放下 a2 的内容)
strcat(arr1,arr1) err 不能追加本身函数
长度受限制的字符串介绍:
strncpy n 复制 n 个元素
strncat(arr1,arr1,len);//str n cat 函数,多了一个追加字符个数,就完美的避过了 本身追加本身时,没有’\0’,导致程序崩溃
strncmp n 比较 n 个元素
字符串查找:
strstr 找子串(找子集)
strtok
错误信息报告:
// strerror
字符操作函数(操作字符的函数)
内存操作函数
memcpy
memmove
memset
memcmp
前言
C语言中对字符和字符串的处理很是频繁,但是C语言本身是没有字符串类型的,
字符串通常放在 常量字符串(char* a =“abcdef”) 中 或者 字符数组(char arr[]=“abcdef”) 中,字符串常量 适用于那些对它不做修改的字符串函数
函数介绍
strlen 函数
strlen 用法: size_t strlen(const char* str)
strlen 函数 它是一个计算字符串长度的函数,在计算长度,并不会改变字符串内容,所以 const 修饰,可以避免意外修改字符串的情况出现,另外是程序更加完美,漂亮。还有 size_t 函数 表示的意思是 strlen函数 的 返回值 为 无符号数。
对于 strlen 函数,我们需要知道并掌握:
1.字符串以 ‘\0’ 作为结束标志,strlen函数 返回的是 字符串中 ‘\0’ 前面出现的字符个数(不包含’\0’)
2.参数指向的字符串必须要以 ‘\0’ 结束
3.注意strlen函数的返回值 为 size_t,是无符号数。
4.学会strlen函数的模拟实现
下面 我们来通过几道程序,来加深我们对 strlen 函数的印象
例题 1
#include<stdio.h>
int main()
{
int len = strlen("abcdef");// 后面隐藏了一个'\0'
printf("%d\n", len);// strlen函数 计算的是 在'\0'之前,有多少个字符(不包含'\0')
// 该字符串 '\0'前面 有 abcdef 6个字符,故 输出为 6
}
例题 2
#include<stdio.h>
int main()
{
char arr[] = { 'a', 'b', 'c', 'd', 'e', 'f' };// 后面 没有 隐藏了一个'\0',即 该字符串缺少'\0'
printf("%d\n", strlen(arr));// strlen函数 计算的是 在'\0'之前,有多少个字符(不包含'\0')
// 该字符串 缺少'\0',所以会一直往后寻找'\0',找到了'\0',就停止计数
// 由于我们不知道,它 往后面寻找多少次,才能找到'\0',
// 所以 输出为 一个随机值
}
模拟实现 strlen 函数
模拟实现 strlen 函数 的三种方法
1.计数器的方法
2. 递归
1.指针减指针
1.计数器方法
程序如下:.
#include<stdio.h>
#include<assert.h>
int my_strlen(const char*a)//我们只是求字符串长度,不会改变字符串内容,所以 加上 const,可以防止通过地址 改变字串串内容
{ // 而且 字符春是一个 常量字符串 也改不了,只能说 加上 const 更保险 更完美
assert(a);// 判断 是否为 空指针
int count = 0;// 创建临时变量,用来计数
while (*a)// 当 *a 等于 '\0' 时,因为'\0'的ASCII码值为 0,条件为假,跳出 while 循环
{
count++;
a++;
}
return count;
}
int main()
{
int ret = my_strlen("abcdef");创建一个变量,用来接收 strlen 返回的 值(元素个数)
printf("%d\n", ret);
return 0;
}
2.递归
在用 递归 实现 strlen 函数之前,我来想大家简单解释一个递归。
举个例子: 递归就像是 一个大箱子,放进去一个比它小一点箱子,这个小一点的箱子,再放一个比它小一点的箱子,以此类推,直到没有更小的箱子放的进去 的 一个 被锁着 的大箱子,我们需要一个接着一个打开,每一个箱子,都装着一个相同的东西,全部打开后,我们需要知道它装了多少个这样的东西,我们先把最小的箱子里的东西拿出来记为 “1”,然后锁上( 表示某一次的函数调用结束 )。再拿它 外一层箱子里跟它装着相同的东西(记为 “2”),以此类推,在把最大的箱子的东西拿掉后(回到了第一次调用递归的表达式,返回它的 “累计结果”),我们知道了 这个套娃箱子,它藏了 多少个 “娃”.。
#include<stdio.h>
#include<assert.h>
int my_strlen(char* a) // 这里不加 const 修饰,是因为 后面 我们需要接收改变后 a 的地址
{
assert(a);// 判断 是否为 空指针
if (*a)// 当 *a 等于 '\0' 时,因为'\0'的ASCII码值为 0,条件为假,跳出 while 循环
{
return 1 + my_strlen(a + 1);// 只要 *a = '\0' 就说明它是一个 不是 '\0' 的元素,记为1个
// 在 a+1 之后 指向下一个元素,并再次调用 my_strlen 自定义 函数,重复上述步骤,重复调用 my_strlen 函数
// my_strlen 函数 总共 返回 6 个 1, 一个 0
// 直到遇到 '\0' 返回 0 ,停止递归。
// 因为 strlen 函数 遇到'\0' 停止计数,得出的元素个数(没有计入'\0')
}
else // 触发 条件, *a == '\0'
{
return 0;// '\0' 不计入个数,所以返回为 0
}
// 即 过程为 1 + (1 + (1 + (1 +(1 + (1 + my_strlen(a + 1))))))
// 因为 第 7 个元素 为 '\0',所以 my_strlen 函数 返回 0
// 故 1 + (1 + (1 + (1 +(1 + (1 + 0)))))
// 1 + (1 + (1 + (1 +(1 + 1)))) -> 1 + (1 + (1 + (1 +2))) -> 1 + (1 + (1 + 3))->
// 1 + (1 + 4) -> 1 + 5 == 6
}
int main()
{
char a[] = "abcdef";
int ret = my_strlen(a);// 这里接收 my_strlen 函数 的 返回值(元素个数,不包括'\0')
printf("%d\n",ret);// 6
return 0;
}
3. 指针 -(减)指针
我们先来通过 一个 图 来 帮助我们理解 指针 - 指针 是怎样得到 两个指针之间的 元素个数
int arr[] = {1, 2, 3, 4, 5,};
int* a = &arr[4]
0x(十六兼职) 01 00 00 00 02 00 00 00 03 00 00 00 04 00 00 00 05 00 00 00(小端存储模式)
| |
指针arr 指针a
两个指针 之间相距 16 个字节内容,即相距 4个整形类型的元素。
指针 - 指针 得到是指针和指针之间 &arr[0]~&arr[4] //左开右闭区间)的元素的个数。
然后然让我通过一道程序,来呈现的它的功能
#include<stdio.h>
int main()
{
char ch[5] = { 0 };
int arr[] = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10 };
printf("%d\n",&arr[9] - &arr[0]);//指针 - 指针 得到是指针和指针之间( &arr[0]~&arr[9] //左开右闭区间)的元素的个数
// 输出为 9
printf("%d\n", &arr[9] - &ch[0]);//这种写法error,因为 指 针减 指针,两者必须是 同一块空间里 的。
return 0;
}
最后再让我们看道 有关 strlen 函数 的程序,加深对 strlen 函数 的印象
#include<stdio.h>
#include<string.h>
int main()
{
if (strlen("abc") - strlen("abcef") > 0)// strlen函数 的 返回值 为 无符号数,无符号减无符号,还是无符号数。
// 无符号数 恒大于 0
{
printf("hehe\n");// 所以输出这条语句
}
else
{
printf("haha\n");
}
return 0;
}
strcpy 拷贝字符串函数: char* strcpy(char* destination,const char* source)
遇到 source 拷贝字符串的 ‘\0’,才会停止拷贝。
需要知晓且掌握:
1.源字符串 必须以 ‘\0’ 结束 (如果缺少 ‘\0’,会导致 strcpy 函数,一直往后面找’\0’,从而形成越界访问 )
2.会将源字符串中的 '\0’拷贝到目标空间
3.目标空间必须足够大,以确保能存放源字符串 (如果目标空间不够大,会导致目标空间"撑破", 会越界访问 不属于目标的空间)
4.目标空间必须可变 (比如 char a = “abcef”(常量字符串,不可改变);char a1[]=“abc”(字符数组); strcmp(a,a1),此时会导致程序崩溃)
5.学会模拟实现
下面让我们通过程序来理解 strcpy 函数 的功能使用
#include<stdio.h>
int main()
{
char arr1[] = "abcdef";
char arr2[] = "hello";
strcpy(arr1, arr2);// arr1目的地地址,arr2 源头数据,
// 拷贝的时候,strcpy函数 会把源头字符串'\0'也考进去
// hello\0\0 最后的 '\0' 是 arr1 后面隐藏的。
printf("%s\n",arr1); // %s 打印字符串,遇到'\0'停止打印(打印内容不包括'\0')
// hello
return 0;
}
模拟实现 strcpy 函数
#include<stdio.h>
#include<assert.h>
char* my_strcpy(char* destination,const char* source)// 源头数据 不作修改,但 加上const 更完美
// strcpy 完成 拷贝后,返回的是 目的地的地址,所以我们函数的 返回类型 为 char*
{
assert(destination&&source);// 判断是否为空指针
char* ret= destination;// 拷贝 一份 destination 地址
//这样做,是因为下方 *destination++,把 destination 的起始位置搞不见了,所以需要 提前 存起来
//留到后面返回 destination 的 起始地址 (因为 strcmp 函数 完成 拷贝后,返回的是 目的地的地址)
while (*destination++ = *source++)// 拷贝 source 指向的字符串 到 destination 的指向的空间(包含'\0')
// 先把*source 赋给 *destination ,
// 等于就是说把 a 改成 h
// h 就是这个表达式的值( h不等于 0 == '\0' ),即为真
// 调用完了,再进行后置加加
// 直到 *source == '\0' == 0,且 把这个值赋给 *destination
// 又因为此时 '\0' == 0.为此时的表达式的值
// 对 while 循环来讲,条件为假
// 此时跳出循环,循环结束
// 你会发现字符串拷贝工作已完成
{
;
}
return ret; // 返回 destination 空间的起始地址
}
int main()
{
char arr1[] = "abcedef";
char arr2[] = "hello";
printf("%s\n", my_strcpy(arr1, arr2)); // hello
return 0;
}
strcat 函数 strcat(char* str1,const char* str2)
1.源字符串必须以 '\0’为结束。
2.目标空间必须有足够大的空间,能容纳下源字符串的内容
3.目标空间必须可修改。
4.字符串 自己给自己 追加 如何? strcat 函数, char a[]=“abc”; strcat (a,a)
“abc\0” -> abca -> abcab -> abcabc
你会发现"\0" 不见了,因为 strcat 是’\0’这个位置,开始接字符串
所以 在 追加 本身函数的话,会丢失 ‘\0’,strcat 函数在追加字符串 时,遇到 追加字符串的’\0’,停止追加
所以 缺少 ‘\0’ 会导致 strcat 函数 一直往后面找’\0’,导致程序崩溃
下面老规矩,程序如下:
程序1:
strcat 函数的使用
#include<stdio.h>
#include<string.h>
int main()
{
char arr1[] = "hello";// arr1 根据 hello\0 确定了空间大小为6
char arr2[] = "world";
strcat(arr1, arr2);// 这样写会导致程序崩溃,因为arr1 空间只有 6 byte,放不下 arr2 的内容
// 从而导致程序崩溃
return 0;
}
程序2:
#include<stdio.h>
#include<string.h>
int main()
{ // 而且 目的地 也要有 '\0',要不然它不知道从哪里开始追加 字符内容
char arr1[30] = "hello";// arr1 给定了空间大小为 30
// hello]0 xxxxxxxxxxxxxxxx
char arr2[] = "world";
strcat(arr1, arr2);// ,因为 arr1 空间有 30b,还剩24,完全放得下 arr2 的字符串内容
printf("%s\n", arr1);// helloworld 打印是遇到'\0'停止,打印内容不包括 '\0'
//hellow xxx -> hellowo xxx -> helllowor xxx -> helloworl xxx ->helloworld xxx -> helloworld\0 xxxxxxxxx
return 0;
}
模拟实现 strcat 函数
#include<stdio.h>
#include<string.h>
#include<assert.h>
char* my_strcat(char*destination, const char*source)// 追加字符串不作改变
//因为 destination 所指是字符类型,所以 返回类型 是 char*
{
assert(destination&&source);// 判断是否为空指针
char* tmp = destination;// 因为我需要观察 arr1 是否追加成功,所以我们返回的是 destination 的起始地址
// 下面 destination 再循环完后,destination 不再是起始地址,所以需要先保存。
//1.找到目的地 字符串的 '\0'
while (*destination)
{
destination++;
}
// 2. 追加
while (*destination++ = *source++)
{
;
}
return tmp;// 返回 destination 的起始地址
}
int main()
{
char arr1[30] = "hello";
char arr2[] = "world";
printf("%s\n", my_strcat(arr1, arr2));// helloworld
return 0;
}
strcmp 比较字符串 函数 : strcmp(const char* st1,const char* arr2);
strcmp 比的是对应的字符 就是说比较 str1 和 str2 下标相同的字符内容
1,第一个字符串(str1) 大于 第二个字符串(str2),则返回大于 0 的数字
2.第一个字符串 等于 第二个字符串,则返回等于 0
3.第一个字符串 小于 德尔格字符串,则返回小于 0 的数字
//两个字符串,arr1 第一个字符 跟 arr2 第一个字符 比较(ASCII码值),只要 那一对 字符不相等,就反回 两个字符串ASCII 码值 的差(arr1 - arr2),另外不同的编译器 显示的是不一样的,gcc 中 就是放回两个ASCII码值的差值
但是 在 vs2013环境中:
差 > 0 返回1 //( arr1 - arr2 )这里是帮助理解,谁的ASCII码值减谁的ASCII 码值
差 == 0 返回 0 (两个字符串完全相同)
差 < 0 返回 -1
下面老规矩:
#include<stdio.h> // vs2013 环境
#include<string.h>
int main()
{
char* p1 = "abcdef";
char* p2 = "abcde";
char* p3 = "abcdef";
char* p4 = "sqwer";
printf("%d\n", strcmp(p1, p2));// p2 的最后一个字符 '\0'的ASCII码值为0 ,对应 p1 倒数第二个字符 f ASCII码值为 102,102(p1)- 0(p2) > 0,则返回 1
printf("%d\n", strcmp(p1, p3));// 两个字符串内容完全相同, 差值为 0,返回 0
printf("%d\n", strcmp(p1, p4));// s 的ASCII码值 比 a 的 大, a - s < 0 ,返回 -1
return 0;
}
模拟实现 strcmp 函数
#include<stdio.h> // vs2013 环境
#include<assert.h>
int my_strcmp(const char* p1,const char* p2)// 因为strcmp 函数 只是来比较字符串的,并不会改变字符串
{ // 加上 const 修饰,使程序更完美,更漂亮
assert(p1&&p2);//判断是否为空指针
// 比较
while (*p1 == *p2)// 判断 下标相同的 字符 是否相同
{
if (*p1 == '\0')// 在 *p1 == *p2 的条件下,有任何一个 等于 '\0',说明,两个字符串完全相等
{
return 0;// 两个字符串完全相等,返回0.
}
*p1++;
*p2++;// 准备下一次 比较
}
if (*p1 > *p2) // 第一次出现这种情况进入,因为 只需要进入一次。
{
return 1; // *p1 - *p2 > 0,在vs2013 里面 返回 1
}
else if (*p1 < *p2)// 第一次出现这种情况进入,因为 只需要进入一次。
{
return -1;// *p1 - *p2 < 0,在vs2013 里面 返回 -1
}
// gcc 环境 return (*p1 - *p2); 即返回它们之间的差值,前者 减 后者
}
int main()
{
char* p1 = "abcdef";
char* p2 = "abqwe";
int ret = my_strcmp(p1,p2);// ab 相同,但 c 比 q 的 ASCII码值 要小,两者差值为负数,所以在vs环境中返回 -1
printf("%d\n", ret);
return 0;
}
以上三个均是 长度不受限制的字符串函数:
strcmp
strcpy
strcat
接下来我们介绍 长度受限制的字符串:
strncpy n 复制 n 个元素
strncat(arr1,arr1,len);
str n cat 函数,多了一个追加字符个数,就完美的避过了 本身追加本身时 没有’\0’,导致的程序崩溃。如果没有’\0’,strcat 会一直往后面找’\0’,最终导致程序崩溃
strncmp n 比较 n 个元素
strncpy 函数
直接程序走起
程序一:
#include<stdio.h>
#include<string.h>
int main()
{
char a1[5] = "abc";
char a2[] = "hello bit";
strncpy(a1, a2,4);// 因为 a1只能放得下 5个字符,所以至多只能放五个元素
// 但是 如果我们把目的地 的 '\0',给覆盖掉了,在打印%s的时候,
//打印完hello之后。就会出现乱码,所以 我选择拷贝 4个字符
// 因为 打印 %s, 遇到'\0'才会停值打印,要不然它就往后一直找'\ 0',从而输出乱码
// 如果这五个元素中,没有'\0',拷贝完成后,是不会在后面补'\0'
// 意思就是你让我拷贝多少个,我就拷贝多少个
// 只要输入正确的 拷贝字符个数,就能避免 因 目的地空间 太小,拷贝内容放不下而造成的程序崩溃。
// 换句话理解 就是 不完全拷贝,只是拷贝部分字符串
printf("%s\n", a1);// hell
return 0;
}
程序二:
#include<stdio.h>
#include<string.h>
int main()
{
char a1[10] = "abcdefg";
char a2[] = "bit";
strncpy(a1, a2, 6);// 这里我想要拷贝 6个字符,但是 a2 只有 4个
// 那么拷贝过去的时候,不够就补'\0',直到满足拷贝 字符个数
// a1[10]= "bit\0\0\0g\0",最后一个'\0'是 a1 后面隐藏的 '\0'
printf("%s\n", a1);// bit
return 0;
}
模拟实现 strncpy 函数
#include<stdio.h>
#include<assert.h>
char* my_strncpy(char* destination, const char* source,size_t k)// 不需要改变source,用const修饰,可以避免意外更改,而且这样写程序更完美
{
assert(destination&&source);
char* tmp = destination;// 因为我需要观察 a1 是否拷贝成功,所以我们返回的是 destination 的起始地址
// 下面 destination 再循环完后,destination 不再是起始地址,所以需要先保存。
while (k && (*destination++ = *source++))// 在k--, 等于 3 时,
{ //再进下一步,*source == '\0',然后赋给*destination
// 同时该表达式值 为 0,跳出循环,
//也就是说,进行了第四次拷贝时,没有进入循环体 k--;
// k应该等于 2 的,但此时 k == 3
k--;
}
if (k)
{
while (--k)//因为我们拷贝 6个字符,不够就补'\0',已经拷贝4个字符,还差2个
{ // --k == 2.下一次就是 1,再下次,刚好等于0,跳出循环,至此,拷贝6个字符已全部完成
*destination++ = '\0';
}
}
return tmp;// 返回目的地 的起始地址
}
int main()
{
char a1[10] = "abcdefg";
char a2[] = "bit";
printf("%s\n", my_strncpy(a1, a2,6));// bit
return 0;
}
strncat 函数
char* my_strncat(char* front, const char* back,size_t k)
程序一:
#include<stdio.h>
int main()
{
char a1[30] = "hello";
char a2[] = "world";
strncat(a1, a2, 3);// 追加字符串,那追加的肯定是 字符串,
// 这里要求追加 a2 前的三个字符的字符,也就说追加字符wor ,但是函数会在后面加 一个'\0'。
// 让成为 一个字符串 "wor",这就是 strncat 的特点,
printf("%s\n", a1);
return 0;
}
程序二:
#include<stdio.h>
int main()
{
char a1[30] = "hello";
char a2[] = "world";
strncat(a1, a2, 8);// 把 world' 赋给a1之后,strncat 函数它就不管了。
// strncpy不一样,strncpy 会补'\0'。
// 请理解记住
printf("%s\n", a1);
return 0;
}
模拟实现 strncat 函数
#include<stdio.h>
char* my_strncat(char*front, const char*back,size_t k)
{
char* tmp = front;// 因为我需要观察 a1 是否追加成功,所以我们返回的是 front 的起始地址
// 下面 front 再循环完后,fornt 不再是起始地址,所以需要先保存。
while (*front++)// 找 '\0',*front == '\0',跳出循环,后置加加,加了一次
{
;
}
front--;// 因为后置加加,多加了一次,所以要减一次
while (k--)// 追加字符个数
{
if (!(*front++ = *back++))//在判断条件中进行追加,直到式子等于 '\0' == 0,!(取反)为真,返回 front 起始地址,也就满足,追加完了,就完了,不会像strncpy 一样去'\0'
{
return tmp;
}
}
*front = '\0';// strncat 函数 会在追加字符(不包含'\0')后,加一个'\0'
return tmp;
}
int main()
{
char a1[30] = "hello";
char a2[] = "world";
printf("%s\n", my_strncat(a1, a2, 8));
return 0;
}
strncmp 函数 int strncmp(const char* str1,const char* str2,size_t count) count 字节个数;返回的值,与 strcmp 是一样的
#include<stdio.h>
#include<string.h>
int main()
{
const char* p1 = "abcdef";
const char* p2 = "abcqwer";
printf("%d\n",strncmp(p1, p2, 3));// 3 表达的意思是 比较前面 3 个字符
//因为前三个字符相同,所以返回值为 0
// 改成 4 的话,d 比 q小,返回 它们ASCII码值的差(gcc环境)
//在vs2013 环境中 返回 -1
return 0;
}
strstr 函数(查找 子字符串) : char* strstr(const char* str1,const char* str2)
#include<stdio.h>
#include<string.h>
int main()
{
char* p = "abcdef";
char* p2 = "def";
char* ret = strstr(p,p2); // 判断 p2 是否为 p 的子符串,
//如果是,返回 p2 在 p 中第一次出现 的地址
//如果不是,返回空指针 NULL
if (ret == NULL)
{
printf("p2 不是 p 的子串\n");
}
else
{
printf("p2 是 p 的子串 p= %s\n",ret);
}
return 0;
}
模拟实现 strstr 函数
#include<stdio.h>
#include<assert.h>
char* my_strstr(const char* str1, const char* str2)
{
assert(str1&&str2);
if (!*str2)// *s2 == '\0' == 0,为假,取反 为真, 执行if 语句,因为s2第一个元素为'\0',就没有追加的必要了
{
return (char*)str1;// 因为 str1, 被const修饰了,,是受保护的,最好 转换一下类型
}
char* s = NULL;
char* s2 = NULL;
char* current = (char*)str1;// 因为 str1, 被const修饰了,,是受保护的,最好 转换一下类型
// 创建两个空指针 为下面的程序备用,接收两个数组的起始地址,同时防止 两地址被改变,而current,是为了记录子串的起始地址
while (*current) //*str1 不等于 '\0',才能进入循环体
{
s = current;// 此时 s 指向 str1 起始地址
s2 = (char*)str2;// 因为 str2, 被const修饰了,,是受保护的,最好 转换一下类型
while ((*s == *s2)&& *s2 && *s)
// *s2 和 *s 等于 '\0' 需要跳出,因为s 或者 s2 所有 元素 已判断完毕,此时 s 和 s2 完全相同,s2 和 s 互为对方的子集
// *s == '\0' == 0 时,表示从current 指向的位置,不是子串的地址 ,需要current++,从下个位置继续判断,因为这个不是,但下一个可能是。
// 如果在运行过程当中 *s2 等于 '\0'==0;但*s 不等于或等于,说明 s 中 有 s2 这个子串
{
s++;
s2++;// 用来确定 两个字符串内容 从current指向的位置开始,往后的字符 是否相等
}
if (!*s2)// *s2 == '\0'//current 指向 字符 d 时,执行完上循环*s2 == '\0' == 0 跳出时,代表着s2 是 s 的子串
{
return current;
}
current++;// 假如p1首元素地址 不是 子串(p2) 的首元素地址,p1current++,指向第二个元素,继续重复上述程序,继续判断子串
//依次类推,直到 current 指向 字符 d 时,p1首元素地址(current指向的位置) 是 子串(p2) 的首元素地址,并且p1有这 子串(p2)一样的的内容,才能说 p2 是 p1 的 子串(子集)
}
// 如果所有循环结束后,current 指向 '\0'(*curren== '\0' == 0)
return NULL;// 找不到子字符串
}
int main()
{
char* p = "abbcdefghi";
char* p2 = "def";
if (my_strstr(p, p2) == NULL)
{
printf("p2 不是 p 的子串\n");
}
else
{
printf("p2 是 p 的子串 p= %s\n", my_strstr(p, p2));// yes
}
return 0;
}
strtok 函数 : char* strtok(char* str,const char* sep);
sep 参数 是个 字符串,定义了 用作 分隔符 的 字符集合
1.第一个参数 指定 一个字符串,它包含了 0 个 或 多个 由 sep 字符串 中 一个 或者多个分隔符的标记
2,strtok函数 找到 str 中的下一个标记,并将其用 \0 结尾,返回一个 指向这个标记 的 指针。
(strtok 函数 会 改变 被操作的字符串,所以在使用 strtok 函数 切分 的 字符串 一般都是 临时拷贝的内容 并且 可修改)
3,strtok 函数的 第一个参数 不为 NULL,函数将找到 str 中 第一个标记,strtok 函数 将保存 它在字符串的位置
- strtok 函数的 第一个参数 为 NULL,函数将在同一个字符串 中 被保存的位置开始,查找下一个标记。
- 如果字符串 中 不存在 更多的 标记,则返回NULL 指针
举个例子:
192.168.31.121
192.168.31.121 - strtok 函数可以把 192 168 31 121 分别拿到
再举个例子
zpw@bitdu.tech zpw 邮箱名。 bitdu 域名 tech 域名后缀
程序一:
#include<stdio.h>
int main()
{
char arr[] = "zpw@bitdu.tech";
char* p = "@.";
char*buf[1024] = { 0 };
// 拷贝一份数据到 buf 里
strcpy(buf, arr);
//切割arr中的字符串
char*ret = strtok(arr, p); // 但是此方法,只能切割 已知 有多少个切割符
printf("%s\n",ret);
ret = strtok(NULL, p);
printf("%s\n", ret);
ret = strtok(NULL, p);
printf("%s\n", ret);
return 0;
}
程序二:
#include<stdio.h>
int main()
{
char arr[] = "zpw@bitdu.tech";
char* p = "@.";
char*buf[1024] = { 0 };
// 拷贝一份数据到 buf 里
strcpy(buf, arr);
//切割buf中的字符串
char*ret = NULL;
for (ret = strtok(arr, p); ret != NULL;ret = strtok(NULL,p))
{
printf("%s\n", ret);
}
return 0;
}
第一个进入这个 for 循环时,它就开始寻找切割点,找到了,将其用 \0 结尾,将其返回 指向 这个切割点(标记)的 指针, 因为 strtok 函数的 第一个参数 不为 NULL,函数将找到 str 中 第一个标记,strtok 函数 将保存 它在字符串的位置
判断条件,判断是否为空指针,不是就输出,下面的语句,再将其第一个参数 改为一个空指针,因为 strtok 函数的 第一个参数 为 NULL,函数将在同一个字符串 中 被保存的位置开始,查找下一个标记
如果字符串 中 不存在 更多的 标记,则返回NULL 指针,然后跳出循环,执行 return 0; 结束程序
程序三:
#include<stdio.h>
#include<assert.h>
int main()
{
char arr[] = "192.168.31.121";
char* p = ".";
char buf[1024] = { 0 };
strcpy(buf, arr);// 拷贝一份 arr 到 buf 里
char* ret = NULL;
for (ret = strtok(arr, p); ret != NULL; ret = strtok(NULL, p))
{
printf("%s\n", ret);
}
return 0;
}
strerror 函数 : char* strerror(int errnum);
返回错误码,所对应的错误信息。(把 错误码 转换成 对应的错误信息,然后 返回 它的地址)
程序一:
#include<stdio.h>
int main()
{
char* str = strerror(0);
printf("%s\n", str);// No error 判断初始化有没有错误
return 0; // strerror(1) 则 输出为 Operation not permitted - 不允许 此操作
// strerror(2) 则 输出为 No such file or directory = 目录下 没有 此文件
// 。。。
// 0 1 2 错误码;每一个错误码 对应 一个错误信息,这个错误信息是用来描述 这个错误码的。
}
程序二:
#include<stdio.h>
#include<errno.h> // errno 是一个全局错误变量(错误码的变量),当C语言的库函数 在执行过程中,发生了错误,就会把对应的错误码赋值到errno中
int main()
{
char* str = strerror(errno);// strerror 函数 与 errno.h 头文件 搭配使用
printf("%s\n", str);
return 0;
}
程序三:
#include<stdio.h>
#include<string.h>
#include<errno.h>
int main()
{
//fopen 打开文件
FILE* pf= fopen("test.txt", "r"); // 打开 test.txt 文件, 打开方式"r" == read -> 读文件。
// 这个函数 打开的文件必须在,否则打开失败,返回的值 是一个 FILE*(file - 文件) 的指针
if (pf == NULL) // fopen 调用失败
{
printf("%s\n",strerror(errno));// 此刻 我们并没有 test.txt 文件
} // 怎么找这个文件呢?
// 来到 我们创建 该项目 的位置 进去,再进去到 与 该项目工程名 相同名字 的文件夹,在里面找这个文件
// 那肯定 是找不到的,返回一个 NULL
//输出为 No such file or directory == 没有 此文件 或 目录
else
{
printf("open file success\n"); // 在对应的 文件下,创建一个 test.txt 文件,就可以输出这条语句
}
return 0;
}
字符分类函数 :
函数 如果它的参数符合下列条件就返回真,否则,返回假
iscntrl 任何控制字符
isspace 空白字符:空格’ ‘,换页’\f’,换行’\n’,回车’\r’,制表符’\t’ 或者 垂直制表符’\v’
isdigit 十进制数字 0~9
isxdigit 十六进制数字,包括所有十进制数字, 小写字母a~f,大写字母 A~F
islower 小写字母 a~z
isupper 大写字母 A~Z
isalpha 字母 a~ z 或 A~ Z
isalnum 字母或者数字,az,AZ,0~9
ispunct 标点符号,任何不属于数字或者字母的图形字符(可打印)
isgraph 任何图形字符
isprint 任何可打印字符,包括图形字符和空白字符
程序一:
#include<stdio.h>
#include<ctype.h>
int main()
{
char ch = 'w';
printf("%d\n",islower(ch));// 如果是小写的,返回一个 非零值,
char ch1 = 'W';
printf("%d\n", islower(ch1)); //如果不是 小写字母,是其它的。则返回 0
int ret = isdigit(ch);// isdigital 判断函数是否为 十进制数,是, 就返回一个十进制数,不是,返回0
printf("%d\n", ret);// 0
return 0;
}
字符转换:
int tolower(int c) 转换为 小写 字母
nt toupper (int c) 转换为 大写 字母
程序一:
#include<stdio.h>
int main()
{
char ch = tolower('Q');
putchar(ch);// q
printf("\n");
putchar(toupper('q'));// Q
return 0;
}
程序二:
#include<stdio.h>
int main()
{
char arr[]="I am A student";
int i = 0;
while (arr[i])
{
if (isupper(arr[i]))
{
arr[i] = tolower(arr[i]);
}
i++;
}
printf("%s\n", arr);// i am a student
return 0;
}
内存函数
memcpy
memmove
memcmp
memset
memcpy(内存拷贝) 函数: void* memcpy(void* destination,const void* source,size_t num)
num 的单位是字节
1,函数 memcpy 从 source 的位置 开始向后复制 num 个字节的数据 到 destination 的 内存位置
2.这个函数在遇到’\0’的时候并不会停下来。
3. 如果 source 和 destination 有任何的重叠,复制的结果都是未定义的
程序一:
#include<stdio.h>
int main()
{
int arr1[] = { 1, 2, 3, 4, 5 };
int arr2[5] = { 0 };
memcpy(arr2,arr1,sizeof(arr1));// memcpy 函数 是一个字节一个字节拷贝的。arr1 是一个整型数组,数组的每一个元素都是整形,内存大小为 4 byte
// 所以用到了,sizeof 计算 arr1 的所占内存的大小。因为我们想要把 arr1 的字节内容 全部拷贝到 arr2 中。
int i = 0;
for (i = 0; i < 5; i++)
{
printf("%d ", arr2[i]);// 1 2 3 4 5
}
printf("\n");
return 0;
}
程序二:
#include<stdio.h>
struct s
{
char name[20];
int age;
};
int main()
{
struct s arr3[] = { { "张三", 20 }, { "李四", 30 } };
struct s arr4[3] = { 0 };
memcpy(arr4, arr3, sizeof(arr3));// memcpy 函数 是一个字节一个字节拷贝的。
printf("%s,%d\n", arr4[0].name, arr4[0].age);// 张三, 20
printf("%s,%d\n", arr4[1].name, arr4[1].age);// 李四, 30
return 0;
}
模拟实现 memcpy 函数
程序一:
#include<stdio.h>
#include<assert.h>
struct s
{
char name[20];
int age;
};
void* my_memcpy(void* destination, const void* source, size_t num)
{
assert(destination&&source);
void* ret = destination;
while (num--)
{
*(char*)destination = *(char*)source;
++(char*)destination;// 先转换类型,再加加
++(char*)source;
}
return ret;
}
int main()
{
struct s arr[] = { { "张三", 20 }, { "李四", 30 } };
struct s arr1[3] = { 0 };
int arr2[] = { 1, 2, 3, 4, 5 };
int arr3[5] = { 0 };
my_memcpy(arr1, arr, sizeof(arr));// 通过调试观察
my_memcpy(arr3,arr2, sizeof(arr2));
return 0;
}
程序二:
#include<stdio.h>
#include<assert.h>
void* my_memcpy(void* destination, const void* source, size_t num)
{
assert(destination&&source);
void* ret = destination;
while (num--)
{
*(char*)destination = *(char*)source;
++(char*)destination;
++(char*)source;
}
return ret;
}
int main()
{
int arr[] = { 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 };
int i = 0;
//my_memcpy(arr+2,arr,20);// 想把 1,2,3,4,5 拷贝到 3,4,5,6,7 即 1, 2, 1,2, 3, 4, 5, 8, 9, 10
//memcpy 库函数可以实现,但是自己做的不行,为什么库函数能处理,
//那是因为 memcpy, 在C语言标准中,memcpy只需要处理 不重叠的内存拷贝就可以。所以我们模拟实现的函数功能不包括重叠情况
// memmove 在 c语言标准中, 处理重叠(不重叠)内存的拷贝
memmove(arr + 2, arr, 20);// 1, 2, 3, 4, 5. 6, 7, 8, 9, 10
for (i = 0; i < 10; i++)
{
printf("%d ", arr[i]);// 1 2 1 2 1 2 1 8 9 10 结果显然不行,这说明,在拷贝的过程中,数组前五个元素已经改变了。所以无法达到我们想要的效果
} // 出现重叠拷贝 -》 使用 memmove 函数( void* destination,const void* source,size_t count ) ,它是处理 内存重叠的 处理
return 0;
}
模拟实现 memmove
从这张图我们得知。destination 大于 source 的地址。 如果从前面往后(从 1 到 5)拷贝,会导致丢失 3,4,5 。
其运行过程 : 1 2 3 4 5 6 7 8 9 10 -> 1 2 1 4 5 6 7 8 9 10 -> 1 2 1 2 5 6 7 8 9 10
-> 1 2 1 2 1 6 7 8 9 10 -> 1 2 1 2 1 2 7 8 9 10 -> 1 2 1 2 1 2 1 8 9 10
如果从前往后拷贝 就可以避免 重叠 情况的发生
: 1 2 3 4 5 6 7 8 9 10 -> 1 2 3 4 5 6 5 8 9 10 -> 1 2 3 4 5 4 5 8 9 10
-> 1 2 3 4 3 4 5 8 9 10 -> 1 2 3 2 3 4 5 8 9 10 ->1 2 1 2 3 4 5 8 9 10
#include<stdio.h>
#include<assert.h>
void* my_memmove(void* destination, const void* source, size_t count)
{
assert(destination&&source);
char* ret = (char*)destination;
if ((destination < source) || (destination > ((char*)source + count)))
{
// 前 -> 后 拷贝
while (count--)
{
*(char*)destination = *(char*)source;
++(char*)destination;
++(char*)source;
}
}
else
{
// 后 -> 前 拷贝
while (count--)// count 调用的时候 count==20, 调用完,后置减减, count == 19 byte
{
*((char*)destination + count) = *((char*)source + count);
}
}
return ret;
}
int main()
{
int arr[] = { 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 };
int i = 0;
//my_memcpy(arr+2,arr,20);// 想把 1,2,3,4,5 拷贝到 3,4,5,6,7 即 1, 2, 1,2, 3, 4, 5, 8, 9, 10
//memcpy 库函数可以实现,但是自己做的不行,为什么库函数能处理,
//那是因为 memcpy, 在C语言标准中,memcpy只需要处理 不重叠的内存拷贝就可以。所以我们模拟实现的函数功能不包括重叠情况
// memmove 在 c语言标准中, 处理重叠(不重叠)内存的拷贝
my_memmove(arr + 2, arr, 20);// 1, 2, 3, 4, 5. 6, 7, 8, 9, 10
for (i = 0; i < 10; i++)
{
printf("%d ", arr[i]);// 1 2 1 2 1 2 1 8 9 10 结果显然不行,这说明,在拷贝的过程中,数组前五个元素已经改变了。所以无法达到我们想要的效果
} // 出现重叠拷贝 -》 使用 memmove 函数( void* destination,const void* source,size_t count ) ,它是处理 内存重叠的 处理
return 0;
}
memcmp 函数 : int memcmp(const void* ptr1,const void* pyr2,size_t num)
1. 比较从 ptr1 和 ptr2 指针 开始的 num 个字节
2. 返回值如下:
程序一:
#include<stdio.h>
int main()
{
int arr1[] = { 1, 2, 3, 4, 5 };
int arr2[] = { 1, 2, 5, 4, 3 };
int ret = memcmp(arr1, arr2, 8);// 比较前 8 个字节内容,即 比较2个整数元素 1,2
//返回他们两个之间差值
//因为相同,所以返回 0
printf("%d\n", ret); // 0
return 0;
}
程序二:
#include<stdio.h>
int main()
{
int arr1[] = { 1, 2, 3, 4, 5 };
int arr2[] = { 1, 2, 5, 4, 3 };
int ret = memcmp(arr1, arr2, 9);// 比较前 9 个字节内容,即 比较2个整数元素 1,2,加上 3 在内存中 一个字节的内容
//因为3 的 内存存储模式为小端,即 03(低位) 00 00 00(高位) 5的 内存形式为 05 00 00 00,
// 所以 把 3 的第一个字节内容 03 与 5 的 第一个字节内容 05 来比较,肯定 是不同的,用 03(arr1) - 05(arr2) < 0
// 返回他们两个之间差值
// 又因为 本程序的编译环境 为 vs2013 ,小于 0 的数 ,返回 -1 ,大于 0 的数 返回 1
printf("%d\n", ret);// -1
return 0;
}
memset 函数 - 内存设置 : void* memset(void* destination,int c,size_t count);
程序一:
#include<stdio.h>
int main()
{
char arr[10] = "";
memset(arr, '#', 10);
int i = 0;
for (i = 0; i < 10; i++)
{
printf("%c ", arr[i]);// # # # # # # # # # #
}
return 0;
}
程序二:
#include<stdio.h>
int main()
{
int arr[10] = { 0 };// 40 byte
memset(arr, 1, 10);// 修改 10 byte 的内容
// int 类型 在内存中所占的 空间大小 为 4 字节(byte)
//而 整数数组 arr 有 10个元素,且 每个元素的 类型 int,即每个函数 内存 空间大小为 4 byte
// 下面 用十六进制来表示 运行 过程
//即 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
// 01 01 01 01 01 01 01 01 01 01 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
int i = 0;
for (i = 0; i < 10; i++)
{
printf("%d ", arr[i]);// 16843009 16843009 257 0 0 0 0 0 0 0
}
return 0;
}
这篇文章就到这里了。