本篇文章聊一下strcpy和memcpy的代码实现,这两个也是c和c++面试中常考的问题点。
1. 手写strcpy
首先看一下,一份标准的strcpy的实现如下:
char *strcpy(char* strDest, const char* strSrc) { assert( (strDest != NULL) && (strSrc != NULL)); char *address = strDest; while((*strDest++ = *strSrc++) != '\0'); return address; }
这里有如下几点需要注意:
- 源字符串要使用const类型,避免在程序中被修改;
- 在函数入口处要加上断言,检查源字符串指针和目标字符串指针是否有为空的,否则会产生不可预料的错误;
- 使用while循环要简单而清晰,使用尽量精简的代码;
- 返回值要是char*,且返回了目标字符串指针的原值,使得函数可以支持链式表达式,增加了函数的附加值。
以上这些点不只适用于strcpy这里,而是我们任何时候写代码都尽量遵循这些规则,这样才能写出高可用、高健壮性的代码。
对于以上代码,我们可以看出来,它是存在隐患的,当源字符串的长度超出目标字符串时,会导致把数据写入到我们无法控制的地址中去,存在很大的风险,所以就有了strncpy,下面也给一个strncpy的实现,如下:
char *strncpy(char* strDest, const char* strSrc, size_t n) { assert( (strDest != NULL) && (strSrc != NULL)); char *address = strDest; while ( n-- && (*strDest++ = *strSrc++) != '\0'); return address; }
要根据输入的长度做一个控制,而往往我们使用的时候,输入的长度都是目标字符串的长度减1,因为要留一个位置给结束符'\0'。
2. memcpy的实现
memcpy的实现其实可以参考strncpy的实现,比如我们把指针类型转换成char*来实现拷贝,这种方式就是按照一个字节一个字节来进行拷贝了,首先还是一睹代码为快,如下:
#include <stdio.h> #include <string.h> struct people { int iAge; char szName[12]; char szSex[3]; }; //模拟memcpy的实现 void * mymemcpy(void *dest, const void *src, size_t n) { if (dest == NULL || src == NULL) return NULL; char *pDest = static_cast <char*>(dest); const char *pSrc = static_cast <const char*>(src); if (pDest > pSrc && pDest < pSrc+n) { for (size_t i=n-1; i != -1; --i) { pDest[i] = pSrc[i]; } } else { for (size_t i= 0; i < n; i++) { pDest[i] = pSrc[i]; } } return dest; } int main() { people stPeople1, stPeople2; memset((void*)&stPeople1, 0x00, sizeof(stPeople1)); memset((void*)&stPeople2, 0x00, sizeof(stPeople2)); stPeople1.iAge = 32; mymemcpy(stPeople1.szName, "li lei", sizeof(stPeople1.szName)); mymemcpy(stPeople1.szSex, "man", sizeof(stPeople1.szSex)); mymemcpy((void*)&stPeople2, (void*)&stPeople1, sizeof(stPeople2)); printf("this people age is %d, name is %s, sex is %s\n", stPeople2.iAge, stPeople2.szName, stPeople2.szSex); return 0; }
我们看mymemcpy的实现,此时是一个字节的实现,但它与strncpy实现不能一样,看一下memcpy实现的注意点:
- 同样的,在函数入口处要检查源字符串指针和目标字符串指针是否有为空的,否则会产生不可预料的错误;
- 因为是按照一个字节拷贝,那就要把形参转换成char*类型来操作;
- 要检查源内存和目标内存是否存在内存重叠,如果目标内存首地址在源内存的中间,则要从后往前拷贝,因为如果从前往后拷贝,那从目标内存首地址开始的地方就会被覆盖掉,如果没有重叠,或者源内存地址在目标内存的中间,那没有关系,可以从前往后拷贝;
- 不能使用'\0'来判断拷贝的结束,因为它是对一整块内存的拷贝,举一个浅显的例子,假设拷贝一个结构体,类似上面代码,那么它很可能拷贝到中间的某个地方就停止了,这个拷贝就相当于没有完成;
- 同样的,memcpy也要返回目标字符串地址;
但是这个时候如果面试官问你,按照4个字节来拷贝,该怎么实现呢?
根据前面的逻辑,其实按照4个字节拷贝就是把指针类型转换成int*来拷贝,不过有一点不同的是,如果按照4个字节来拷贝,就没办法去判断内存重叠的情况了,因为内存的基本单位是一个字节,4个字节是没有办法避免覆盖情况的,一个可用的4个字节拷贝代码如下:
void * mymemcpy(void *dest, const void *src, size_t n) { if (dest == NULL || src == NULL) return NULL; int *pDest = (int*)dest; int *pSrc = (int*)src; int iWordNum = n/4; int iSlice = n%4; while(iWordNum--) { *pDest++ = *pSrc++; } char* pcDest = (char*)pDest; char* pcSrc = (char*)pSrc; while(iSlice--) { *pcDest++ = *pcSrc++; } return dest; }
按照4个字节判断,一个清晰的思路是满足4个字节的按照int类型去拷贝,不满足4个字节的就还是按照char类型去拷贝。