数组

前言

在C语言中,数组和指针似乎总是“暧昧不清”,有时候很容易把它们混淆。本文就来理一理数组和指针之间到底有哪些异同。

数组回顾

在分析之前,我们不妨回顾一下数组的知识。数组是可以存储一个固定大小的相同类型元素的顺序集合。为了便于我们说明,假设有以下数组声明:

int a[5];
char b[] = "hello";

数组大小必须在编译期就作为一个常数确定下来。但C99中引入了变长数组,允许数组的维度是表达式 ,但在数组分配内存时,其表达式的值可以被求出。
数组下标运算实际上都是通过指针进行的,也就是说a[4]*(a+4)是等价的,甚至你会发现和4[a]也是一样的。数组名一般代表了指向该数组下标为0的元素的指针,并且printf("%s\n", b)printf("%s\n", &b[0])等效。

数组和指针不相等

考虑下面的声明:

int c[4];    //假设int占4字节
int *d;

对于上面的声明,编译器会给c预留内存空间4*4字节,并且数组名代表着指向数组第一个元素的指针。但对于d,却只为指针本身保留了内存空间。所以此时有下面的操作:

c[3];        //合法
*(c+3);      //合法
*d;          //不合法,d指向了内存中不确定位置
c++;        //不合法,一维数组名是指针常量,常量不能被修改掉
d++;        //可通过编译

另外,下面的两种情况也是不一样的:

char c[] = "hello";
char *d = "hello";

前者对字符数组c进行了初始化,后者将d指向了字符串常量。字符串常量存储在只读区,因此有下面的操作:

c[0] = 'H';  //合法,可修改数组内容
*d = 'H';    //不合法,字符串常量内容不可更改
d[0] = 'H'   //不合法

数组名的含义

绝大多数情况,数组名都代表着指向该数组中下标为0的元素的指针,但是有例外:

int e[4];    //假设int为4字节
sizeof(e);

上面的sizeof(e)的值并非4或8(指针占用空间),而是4*4 = 16。也就是说,当数组名被用作运算符sizeof的参数时,它的计算结果是整个数组的大小,而非第一个元素的指针大小。再来看下面这种情况:

int temp[5];
char *p = &temp;
char *q = temp;

在这里,p和q的值是一样的,含义却不一样,前者是指向数组的指针,而后者是指向该数组中下标为0的元素的指针。因此p+1指向了temp的末尾,而q+1指向了temp的第2个元素。

数组长度计算

如何计算数组长度?考虑下面的代码:

int f[] = {1,2,3,4,5,6};
int *g = f;
size_t len_f = sizeof(f)/sizeof(int)//正确计算方法
size_t len_g = sizeof(g)/sizeof(int)

上面的len_f和len_g的值相等吗?显然并不相等。事实上,只有len_f得到了数组f的长度,而len_g的值并没有任何实际意义。

不能作为参数的数组

所谓的数组不能作为参数,并不是指声明的数组不能作为参数传递,而是指当数组名作为参数时,数组名会被转换为指向该数组下标为0的元素的指针。而下面的两种声明,其实也是等效的:

size_t arrayLen(const int *arr);
size_t arrayLen(const int arr[]);

我们来看一个例子,说明数组作为参数的情况:

#include <stdio.h>
int arraySum(const int arr[])
{
    unsigned int loop = 0;
    /*循环前计算好长度,提高性能*/
    unsigned int len = sizeof(arr)/sizeof(int);
    int sum = 0;
    if(NULL == arr)
    {
        return 0;
    }
    for(loop = 0; loop < len; loop++)
    {
        sum+=arr[loop];
    }
    return sum;
}
int main()
{
    int a[] = {1,2,3,4,5,6};
    int sum = arraySum(a);
    printf("arr sum is %d",sum);
    return 0;
}

我们运行上面的程序,发现最终结果并不是我们预期的21,而是3。问题在于,a作为参数传入到arraySum中时,它是作为指针的,那么在函数内部计算sizeof(arr)自然只是得到了指针占用的内存大小。对于64位程序,这个大小是8,那么len的值为2,最终只计算了两个元素的和。

思考:该如何修改上面的程序才能得到正确的结果?

总结

我们来总结一下前面的核心内容:
• 数组下标运算实际上都是通过指针进行的。
• 数组名代表着指向该数组中下标为0的元素的指针,但有例外:sizeof(数组名)返回整个数组的大小,而非指针大小;&数组名返回一个指向数组的指针,而不是指向该数组中下标为0的元素的指针的指针。
• 数组名作为参数时,数组名会被转换成指向该数组下标为0的元素的指针。
• 指针操作可能比下标操作效率高,但可维护性却不一定有下标操作好。
• 数组和指针不相等。

思考

下面的代码输出结果是什么?

#include<stdio.h>
int main()
{

    int a[5] = {1,2,3,4,5};
    int *p = (int*)(&a+1);
    printf("%d,%d",*(a+1),*(p-1));
    return 0;
}

   转载规则


《数组》 吴杭沉 采用 知识共享署名 4.0 国际许可协议 进行许可。
 上一篇
二维数组 二维数组
二维数组我们知道 C 语言没有真正意义上的二维数组。二维数组的实现,只是简单地通过“线性扩展”的方式进行。如图所示, int b[4][5];就是定义 4 个元素,每个元素都是一个包含 5 个整型变量的一维数组。它在内存中依然是以线性的形式
2024-08-26
下一篇 
语言链接 语言链接
提供以不同程序语言编写的模块间的连接。 extern 字符串字面量 { 声明序列(可选) } (1) extern 字符串字面量 声明 (2)1) 将语言说明字符串字面量应用到声明于声明序列中的所有函数类型,具有外部连接的函
2024-08-14
  目录