arrayexpress数据库简介

转载

mob64ca1402a190 2024-09-11 14:36:53

文章标签 arrayexpress数据库简介数组数据时间复杂度 文章分类 架构后端开发

数据结构：数组讲解

一、概念：

数组（Array）是一种线性表数据结构。它用一组连续的内存空间，来存储一组具有相同类型的数据。

1.线性表与非线性表：

线性表就是数据排成像一条线一样的结构。每个线性表上的数据最多只有前和后两个方向。其实除了数组，链表、队列、栈等也是线性表结构。

arrayexpress数据库简介_数据

非线性表，比如二叉树、堆、图等。之所以叫非线性，是因为，在非线性表中，数据之间并不是简单的前后关系。

arrayexpress数据库简介_数据_02

2.连续内存空间和相同类型的数据：

连续内存空间，相同的数据类型，所以数组可随机访问。

优点：具有随机访问的特性；
缺点：删除，插入数据效率低；

因为删除、插入操作。为了保证数组的连续性，都需要做大量的数据搬移工作；

二、数组如何实现下标随机访问元素？

arrayexpress数据库简介_数组_03

首先我们用长度位10的 int 类型数组来举例；
计算机给数组 a[10]，分配了一块连续内存空间 1000 ~ 1039；
内存块的首地址位 base_address = 1000；
数组中存储的是 int 类型数据，所以类型的大小为 4个字节；

计算机会给每个内存单元分配一个地址，通过地址来访问内存中的数据。当计算机随机访问数组中的某个元素时，它会首先通过下面的寻址公式，计算出该元素存储的内存地址：

a[i]_address = base_address + i * data_type_size

base_address：内存块首地址位；
i：下标位置；
data_type_size：数组中元素的大小；

数组在什么情况下时间复杂度为O(1)？

正确的表述，数组支持随机访问，根据下标随机访问的时间复杂度为O(1)。

三、数组的插入、删除：

数组为了保持内存数据的连续性，会导致插入、删除这两个操作比较低效。

1.插入操作：

往数组中，随机插入一个数据，比如下面操作：

假设数组的长度为n;
现在，需要将一个数据插入到数组中的第 k 个位置;
为了把第 k 个位置腾出来，给新的数据占用，我们需要将第 k～n 这部分的元素都顺序地往后挪一位；
时间复杂度O(n)

往数组末尾插入元素：

往数组末尾插入数据，就不需要移动数据了；
时间复杂度O(1)

往数组头部插入元素：

往数组头部插入数据，那所有的数据都需要依次往后移动一位；
最坏的时间复杂度O(n)

那么有没有办法提高数组的插入效率？

答案当然是有的。前提是数组只是被当作存储数据的集合，不考虑存储的有序性。要将某个数据插入到第 k 个位置，为了避免大规模的数据搬移，可直接将第 k 位的数据搬移到数据元素的最后，把心的元素直接放入第 k 个位置。
如图所示：

数组中存储 5 个元素：a，b，c，d，e；
将元素 x 插入到第 3 个位置，只需将 c 放入 a[5]，将 a[2] 赋值为 x；
在第 k 个位置插入一个元素的时间复杂度就会降为O(1)；

2.删除操作：

跟插入数据类似，如果要删除第 k 个位置的数据，为了内存的连续性，需要搬移数据，不然中间就会出现空洞，内存就不连续了。

随机删除数据；

平均情况时间复杂度为O(n)

删除末尾数据：

最好情况时间复杂度O(1)

删除开头的数据：

最坏情况时间复杂度为O(n)

那么有没有办法提高数组的删除效率呢？

插入都有办法，删除也不类外。数组a[10] 中存储 8 个元素：a，b，c，d，e，f，g，h。现在我们依次删除a，b，c三个元素；
如图所示：

为了避免d，e，f，g，h 这几个数据都会被搬移三次，我们可以先记录下已经删除的数据；
每次删除操作，并不是真正的搬移数据，只是记录数据已经被删除；
当数组没有更多空间存储数据时，再触发一次真正的删除操作，这样就减少了删除操作导致的数据搬移；

四、数组是如何动态扩容的？

数组本身在定义的时候需要预先指定大小，因为需要分配连续的内存空间。如果申请了大小为 10 的数组，当第 11 个数据存储到数组中，我们就需要重新分配一块更大的空间，将原来的数据复制过去，然后再将新的数据插入。需要注意，扩容操作涉及内存申请和数据搬移，是比较耗时的。

五、为什么大多数编程语言中，数组都是从0开始编号，而不是从1开始呢？

首先看上述已经提到过的寻址公式：

a[i]_address = base_address + i * data_type_size

a 来表示数组的首地址；
a[0] 就是偏移为 0 的位置，也就是首地址；
a[i] 就表示偏移 i 个 bada_type_size的位置；

如果数组从 1 开始计数，那么我们计算数组元素 a[i] 的内存地址就会变为：

a[i]_address = base_address + (i-1) * data_type_size

比较两个公式，可发现，从1开始编号，每次随机访问数组元素都多了一次减法运算，对CPU来说，就是多了一次减法指令。

数组作为很基础的数据结构，通过下标随机访问数组元素也是非常基础的操作，效率的优化就要做到极致。所以为了减少一次减法操作，数组选择从0开始编号，而不是1。

参考资料：

《数据结构与算法之美》

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：python实现表级血缘关系分析

下一篇：Android studio如何导入包含新版步骑行导航仅支持aar开发包格式的地图包

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯