前文列表
《程序编译流程与 GCC 编译器》
《C 语言编程 — 基本语法》
《C 语言编程 — 基本数据类型》
《C 语言编程 — 变量与常量》
《C 语言编程 — 运算符》
《C 语言编程 — 逻辑控制语句》
《C 语言编程 — 函数》
《C 语言编程 — 高级数据类型 — 指针》
数组是具有相同数据类型,并且按照一定顺序排列的一组变量的集合。
数组都是由连续的内存空间组成的,最低的地址对应第一个元素,最高的地址对应最后一个元素。数组中的特定元素可以通过索引访问,数组的索引从 0 开始。
特征:
- 有序性:数组元素之间具有固定的先后顺序
- 可索引:通过数组名和下标可以唯一地确定数组中的元素
在 C 中要声明一个数组,需要指定元素的类型和元素的数量。
- 其中元素的数量为不可变量,C/C++ 不允许对数组的长度做动态定义。
- 数组名除了作为数组辨识名称之外,也表示了该数组存储空间的首地址,即数组名本身就是数组的内存入口地址,指向第一个元素。
- 一次只能使用数组中的单个元素,而不能一次使用整个数组。
// 正确用法:一次只能使用数组中的单个元素。
// 将 aArray 的数据复制到 bArray 中。
int aArray[5] = {1, 2, 3, 4, 5};
int bArray[5] = {0};
for(int i = 0; i < 5; i++)
{
bArray[i] = aArray[i];
}
// 错误用法:
int aArray[5] = {1, 2, 3, 4, 5};
int bArray[5] = {0};
bArray = aArray; //不可给整个数组赋值
需要注意的是,使用数组时,需要主动的对数组变量进行边界检查。C/C++ 在编译过程并没有缺省的边界检查动作,所以在程序运行过程中当数组下标索引值越界时,并不会立即触发错误,存在潜在的逻辑异常风险。
#include <stdio.h>
// 如下例所示,aArray[i*j] 在程序进行过程中,下标会超出其数组大小。
// 但是在编译和运行过程中,并不会报错,因此必须由编程人员对此边界进行处理!
int main(void)
{
int i, j;
int aArray[5] = {1, 2, 3, 4, 5};
for (i = 0; i < 5; i++)
{
for (j = 0; j < 5; j++)
{
aArray[i * 5 + j] = i * 5 + j;
printf("aArray[%d]=%d\r\n", i * 5 + j, aArray[i * 5 + j]);
}
}
return 0;
}
/*
[root@c-dev ~]# ./main
aArray[0]=0
aArray[1]=1
aArray[2]=2
aArray[3]=3
aArray[4]=4
aArray[5]=5
aArray[11]=32718
aArray[10]=10
aArray[11]=11
aArray[12]=12
aArray[13]=13
aArray[14]=14
aArray[15]=15
aArray[16]=16
aArray[17]=17
aArray[18]=18
aArray[19]=19
aArray[20]=20
aArray[21]=21
aArray[22]=22
aArray[23]=23
aArray[24]=24
段错误
*/
// 上错误示例可改为:
// 当然像示例中的简单数组越界在编程过程中是十分容易避免的,但对于复杂度高的问题,必须是要增加边界检查的。
int main(void)
{
int i, j, idx;
int aArray[5] = {1, 2, 3, 4, 5};
for (i = 0; i < 5; i++)
{
for (j = 0; j < 5; j++)
{
idx = i * 5 + j;
if (idx > sizeof(aArray) / sizeof(int))
{
printf("Err: idx over range!\r\nMax idx = %lu,idx=%d\r\n", sizeof(aArray) / sizeof(int), idx);
return 0;
}
aArray[idx] = idx;
printf("aArray[%d]=%d\r\n", idx , aArray[idx]);
}
}
return 0;
}
/*
[root@c-dev ~]# ./main
aArray[0]=0
aArray[1]=1
aArray[2]=2
aArray[3]=3
aArray[4]=4
aArray[5]=5
Err: idx over range!
Max idx = 5,idx=6
*/
初始化数据
- 指定数组长度的初始化:大括号 { } 之间的值的数目不能大于我们在数组声明时在方括号 [ ] 中指定的元素数目。
double balance[5] = {1000.0, 2.0, 3.4, 7.0, 50.0};
- 不指定数组长度的初始化:数组的长度则为初始化时元素的个数。
double balance[] = {1000.0, 2.0, 3.4, 7.0, 50.0};
- 对指定的元素进行赋值
balance[4] = 50.0;
访问数组元素
数组元素可以通过数组名称加索引进行访问。元素的索引是放在方括号内,跟在数组名称的后边。
将一个数组元素取出并赋值给新的变量:
double salary = balance[9];
二维数组
C 语言支持多维数组。多维数组声明的一般形式如下:
type name[size1][size2]...[sizeN];
int threedim[5][10][4];
- 二维数组
初始化二维数组:
int a[3][4] = {
{0, 1, 2, 3} , /* 初始化索引号为 0 的行 */
{4, 5, 6, 7} , /* 初始化索引号为 1 的行 */
{8, 9, 10, 11} /* 初始化索引号为 2 的行 */
};
//or
int a[3][4] = {0,1,2,3,4,5,6,7,8,9,10,11};
访问二维数组元素:
int val = a[2][3];
指向数组的指针
数组变量名(标识符)的本质是一个指向数组中第一个元素的常量指针。
double balance[50];
如上,变量名 balance 是一个指向内存地址 &balance[0]
的指针,即数组 balance 的第一个元素的地址。使用数组名作为常量指针是合法的,反之亦然。因此,*(balance + 4)
是一种访问 balance[4] 数据的合法方式。
如果函数想接受一个数组(实际上是指针数组入口的指针)作为实参,那么函数必须使用以下三种方式之一来声明函数的形式参数,每种方式都是告诉编译器函数将要接收一个整型指针。同样地,也可以传递一个多维数组作为形式参数。
- 方式 1
void myFunction(int *param){}
- 方式 2
void myFunction(int param[10]){}
- 方式 3
void myFunction(int param[]){}
示例:
#include <stdio.h>
/* 声明一个函数形参为整型指针类型 */
double getAvg(int arr[], int size);
int main(){
/* 定义并初始化一个数组变量 */
int balance[5] = {1000, 2, 3, 17, 50};
/* 传递一个指向数组的指针作为函数实参 */
double avg = getAvg(balance, 5);
printf("AVG: %f", avg);
return 0;
}
double getAvg(int arr[], int size){
int i;
double avg;
double sum = 0;
for(i = 0; i < size; ++i){
sum += arr[i];
}
avg = sum / size;
return avg;
}
从函数返回一个数组指针
C 语言不允许函数返回一个完整的数组,但是可以返回一个指向数组的指针。注意,C 不支持在函数外部返回局部变量的地址,除非定义局部变量为 static 变量。
int * myFunction(){}
示例:
#include <stdio.h>
#include <stdlib.h>
#include <time.h>
/* 定义返回整型指针类型结果的函数 */
int * getRandom(){
static int r[10];
int i;
srand((unsigned)time(NULL));
for(i = 0; i < 10; ++i){
r[i] = rand();
printf("r[%d] = %d\n", i, r[i]);
}
return r;
}
int main(){
/* 定义一个整型指针变量 */
int *p;
int i;
p = getRandom();
for(i = 0; i < 10; i++){
printf("*(p + %d): %d\n", i, *(p + i));
}
return 0;
}
运行:
$ ./main
r[0] = 640773756
r[1] = 1617898688
r[2] = 2004130180
r[3] = 494154148
r[4] = 1999308605
r[5] = 959614519
r[6] = 81389324
r[7] = 1893093458
r[8] = 2121376870
r[9] = 1095386666
*(p + 0): 640773756
*(p + 1): 1617898688
*(p + 2): 2004130180
*(p + 3): 494154148
*(p + 4): 1999308605
*(p + 5): 959614519
*(p + 6): 81389324
*(p + 7): 1893093458
*(p + 8): 2121376870
*(p + 9): 1095386666
指针数组
有一种情况,我们想用数组来存储指向 int 或 char 或其他数据类型的指针。下面是一个指向整数的指针数组的声明:
int *ptr[MAX];
在这里,把 ptr 声明为一个数组,由 MAX 个整型指针组成。因此,ptr 中的每个元素,都是一个指向 int 值的指针。
#include <stdio.h>
const int MAX = 3;
int main ()
{
int var[] = {10, 100, 200};
int i, *ptr[MAX];
for ( i = 0; i < MAX; i++)
{
ptr[i] = &var[i]; /* 将 int 值的地址赋值到整型指针数组 */
}
for ( i = 0; i < MAX; i++)
{
printf("Value of var[%d] = %d\n", i, *ptr[i] );
}
return 0;
}
数组名和取数组首地址的区别
int array[4] = {0};
以上述语句为例,&array
取的是整个数组 array 的首地址,为数组变量明 array 则是数组首元素的内存地址,即:&array[0]
。需要注意的是,&array
和 array
两者的值虽然相同,但是意义却不同。
#include <stdio.h>
int main() {
int array[4] = {0};
printf(" array = %p\n", array);
printf(" &array = %p\n", &array);
printf(" array + 1 = %p\n", array + 1);
printf("&array[0] + 1 = %p\n", &array[0] + 1);
printf(" &array + 1 = %p\n", &array + 1);
printf("\n");
printf(" sizeof(array) = %lu\n", sizeof(array));
printf("sizeof(&array) = %lu\n", sizeof(&array));
printf("\n");
return 0;
}
运行:
$ ./main
array = 0x7fffe3743ae0
&array = 0x7fffe3743ae0
array + 1 = 0x7fffe3743ae4
&array[0] + 1 = 0x7fffe3743ae4
&array + 1 = 0x7fffe3743af0
sizeof(array) = 16
sizeof(&array) = 8
结论:
- 在 C 中, 在几乎所有使用数组的表达式中,数组名的值是个指针常量,也就是数组第一个元素的地址。 它的类型取决于数组元素的类型: 如果它们是 int 类型,那么数组名的类型就是 “指向 int 的常量指针“。
- 在以下两中场合下,数组名并不是用指针常量来表示:1)当数组名作为
sizeof
运算符操作数时,返回整个数组的长度,而不是指向数组的指针的长度;2)当数组名作为地址运算符&
的操作数时,返回的是一个指向整个数组的指针,而不是指向数组首元素的指针。 - 指针的
+1
是偏移量问题:一个类型为 X 的指针的移动,是以sizeof(X)
为移动步进的。array+1
:在数组首元素的内存地址的基础上,偏移一个sizeof(array[0])
单位。上例中,为0x7fffe3743ae0 + 1 * sizeof(array[0]) == 0x7fffe3743ae0 + 1 * sizeof(int) == 0x7fffe3743ae0 + 4 == 0x7fffe3743ae4
。&array+1
:在数组的首地址的基础上,偏移一个sizeof(array
单位。上例中,为0x7fffe3743ae0 + 1 * sizeof(array) == 0x7fffe3743ae0 + 1 * sizeof(int) * 0x4 == 0x7fffe3743ae0 + 0x16 == 0x7fffe3743af0
。
简而言之,数组名 array
的指针是数组基类型(首元素)的地址长度,而 &array
的指针是整个数组的地址长度。