数据结构(一)——数据结构简介

    本系列博客为学习狄泰学院《数据结构实战开发教程》笔记并根据网络资料总结而来。

    狄泰学院:https://dt4sw.ke.qq.com/

一、数据结构简介

数据结构是相互间存在特定关系的数据的集合,分为逻辑结构和物理结构。

1、逻辑结构

f89ffac0f27a22773b514f8ea03976c3.jpg

    集合结构:数据元素之间没有特别的关系,仅同属相同集合。

    线性结构:数据元素间是一对一的关系

    树形结构:数据元素间存在一对多的层次关系

    图形结构:数据元素之间是多对多的关系

2、物理结构

物理结构是逻辑结构在计算机中存储形式,分为顺序存储结构和链式存储结构。

顺序存储结构将数据存储在地址连续的存储单元里。

链式存储结构将数据存储在任意的存储单元里,通过保存地址的方式找到相关联的数据元素。

497c1003e0320602ddac08bea69c7fff.jpg

二、算法简介

算法是特定问题求解步骤的描述,是独立存在的一种解决问题的方法和思想。

1、算法的特性

    输入:有0个或多个输入

    输出:至少有1个或多个输出

    有穷性:算法在有限的步骤后应该自动结束而不会无限循环。

    确定性:算法中的每个步骤都有确定的含义,不会出现二义性

    可行性:算法的每一步都是可行的

    正确性:算法对于合法数据能够得到满足要求的结果,能够处理非法输入,并得到合理的结果。

    可读性:算法要便于阅读、理解和交流

    健壮性:算法不应该得到莫名其妙的结果

    性价比:利用最少的资源得到满足要求的结果

2、算法效率的度量

效率评估是工程中算法最重要的附加特性。

1)、事后统计法

比较不同算法对同一组输入数据的运行处理时间。

缺点:

A、为了获得不同算法的运行处理时间必须编写相应程序

B、运行处理时间严重依赖硬件以及运行时环境

C、算法的测试数据选取困难

2)、事前分析统计

依据统计的方法对算法效率进行评估

影响算法效率的主要因素:

A、算法采用的策略和方法

B、问题的输入规模

C、编译器产生的代码

D、计算机的执行速度

算法效率的简单估算:

2435a8bdaad13bbfc26a186308402464.png

dcedfaf0c818ec1d1a6ddb780e132c5b.png

2e53f2da89f3ea92326636b603ce799d.png

三种求和算法的关键部分的操作数量分别为2nn1。随着问题规模的增大,操作数量的差异会越来越大,效率差异也会越来越大。

f019b71c0542dfffe34916c5dafdbae3.png


不同算法操作数量的对比

算法操作数量对比的实例一:

1f1f4b220fd610f8d033b5f579c14014.png

n<=3时,算法B优于算法A。随着n的规模增大,算法A优势比较明显。

算法操作数量对比的实例二:

0e2c64f8fc297539b47bd14862b49fe6.png

n=1时,算法C与算法D效率相同。随着n规模的增大,算法C优势明显优于算法D

判断算法的效率时,操作数量中的常数项和其他次阶项常常可以忽略,只需要关注最高阶项。

3、算法的复杂度

1)算法的时间复杂度

算法时间复杂度是算法运行后对时间需求量的定性描述。

由于主要关注算法的效率问题,因此主要讨论算法的时间复杂度。

O表示法

算法的效率严重依赖于操作(Operations)数量,操作数量的估算可以作为时间复杂度的估算,在判断时首先关注操作数量的最高阶项。

O2==>O1

O3n+3==> O3n==>On

O3n^2+n+4==>On^2

常见的时间复杂度:

3bad4e0bbb70214203b3f91ee1993a63.png

beba971dd6384780c363bf70deeacc36.png

4dae3d0ab36882f1648ba3bf0a2cafd6.png

64623a88c501b8a4926834f3b1293c7c.png

2)算法的空间复杂度

算法空间复杂度是算法运行后对空间需求量的定性描述。

通常使用Sn)表示算法的空间复杂度。使用时间复杂度的推导方法推导空间复杂度。

当算法所需的内存空间大小为常数时,算法的空间复杂度为S1)。

通常情况下,算法的时间复杂度更受关注。可以通过增加额外空间降低时间复杂度。

算法是解决具体问题的步骤,数据结构是算法解决问题的载体。

4、算法实例

    一个数组中存储着1——1000的数字,每个数字可能出现多次或者不出现,找出出现次数最多的数字。

void search(int array[], int len)

{

  //总计可能出现1000种可能值

  int sp[1000] = {0};

  int max = 0;

  for(int i = 0; i < len; i++)

  {

      //遍历数组,数组中某个数组出现一次增加统计1

      sp[array[i] - 1]++;

  }

  for(int i = 0; i < 1000; i++)

  {

      if(max < sp[i])

      {

          max = sp[i];

      }

  }

  for(int i = 0; i< 1000; i++)

  {

      if(max == sp[i])

      {

          cout << "Number:" << i + 1 << endl;

          cout << "Count:" << max << endl;

      }

  }

}

使用空间换时间,算法的时间效率为On)。