【数据结构】(一)数据结构入门

数据结构入门

数 据 结 构 + 算 法 = 程 序 数据结构+算法=程序 +=

1 数据结构基础知识

数据
指所有能输入到计算机中的描述客观事物的符号,包括文本、声音、图像、符号等。

数据元素
数据元素是数据的基本单位,也称节点或记录,如下图所示。

数据项
数据项表示有独立含义的数据最小单位,也称域。若干个数据项构成一个数据元素,数据项是不可分割的最小单位,如上图所示的“86”。

数据对象
数据对象是指相同特性的数据元素的集合,是数据的一个子集。

数据结构
数据结构是指相互之间存在一种或多种特定关系的数据元素的集合。

数据结构是带“结构”的数据元素的集合,“结构”是指数据元素之间存在的关系。数据结构研究的问题是将带有关系的数据存储在计算机中,并进行相关操作。
在这里插入图片描述

逻辑结构是数据元素之间的关系,存储结构是数据元素及其关系在计算机中的存储方式。例如,小明和小勇是表兄弟,这是他们之间的逻辑关系;他们在教室里面的位置是他们的存储结构。

逻辑结构:数据元素间抽象化的相互关系,与数据的存储无关,独立于计算机,它是从具体问题中抽象出来的数学模型。

(1)集合——数据元素间除“同属于一个集合”外,无其他关系。

集合中的元素是离散、无序的,就像鸡圈中的小鸡一样,可以随意走动,它们之间没有什么关系,唯一的亲密关系就是在同一个鸡圈里,如下图所示。
在这里插入图片描述

(2)线性结构——一个对一个,如线性表、栈、队列、数组、广义表。
线性结构就像穿珠子,是一条线,不会分叉,如图1-3所示。有唯一的开始和唯一的结束,除了第一个元素外,每个元素都有唯一的直接前驱(前面那个);除了最后一个元素外,每个元素都有唯一的直接后继(后面那个)。
在这里插入图片描述
(3)树形结构——一个对多个,如树。
树形结构就像一棵倒立的树,树根可以发出多个分支,每个每支也可以继续发出分支,树枝和树枝之间是不相交的,如图
在这里插入图片描述

(4)图形结构——多个对多个,如图、网。
图形结构就像我们经常见到的地图,任何一个节点都可能和其他节点有关系,就像一张错综复杂的网,如图
在这里插入图片描述

存储结构:数据元素及其关系在计算机中的存储方式。

(1)顺序存储
顺序存储是指逻辑上相邻的元素在计算机内的存储位置也是相邻的。例如,张小明是哥哥,张小波是弟弟,他们的逻辑关系是兄弟,如果他们住的房子是前后院,也是相邻的,就可以说他们是顺序存储,如图
在这里插入图片描述

顺序存储采用一段连续的存储空间,将逻辑上相邻的元素存储在连续的空间内,中间不允许有空。顺序存储可以快速定位第几个元素的地址,但是插入和删除时需要移动大量元素,如图
在这里插入图片描述
(2)链式存储
链式存储是指逻辑上相邻的元素在计算机内的存储位置不一定是相邻的。例如,哥哥张小明因为工作调动去了北京,弟弟仍然在郑州,他们的位置是不相邻的,但是哥哥有弟弟家的地址,很容易可以找到弟弟,就可以说他们是链式存储,如图
在这里插入图片描述

链式存储就像一个铁链子,一环扣一环才能连在一起。每个节点除了数据域,还有一个指针域,记录下一个元素的存储地址,如图
在这里插入图片描述

(3)散列存储
散列存储,又称哈希(Hash)存储,由节点的关键码值决定节点的存储地址。用散列函数确定数据元素的存储位置与关键码之间的对应关系,如图
在这里插入图片描述

(4)索引存储
索引存储是指除建立存储节点信息外,还建立附加的索引表来标识节点的地址。索引表由若干索引项组成。如果每个节点在索引表中都有一个索引项,则该索引表称为稠密索引。若一组节点在索引表中只对应于一个索引项,则该索引表称为稀疏索引。索引项的一般形式是关键字、地址,如图
在这里插入图片描述

抽象数据类型
抽象数据类型(Abstract Data Type, ADT)是将数据对象、数据对象之间的关系和数据对象的基本操作封装在一起的一种表达方式,它和工程中的应用是一致的。在工程项目中,开始编程之前,首先列出程序需要完成的功能任务,先不用管具体怎么实现,实现细节在项目后期完成,一开始只是抽象出有哪些基本操作。把这些操作项封装为抽象数据类型,等待后面具体实现这些操作。而其他对象如果想调用这些操作,只需要按照规定好的参数接口调用,并不需要知道具体是怎么实现的,从而实现了数据封装和信息隐藏。在C++中可以用类的声明表示抽象数据类型,用类的实现来实现抽象数据类型的具体操作。

抽象数据类型可以用以下的三元组来表示。
在这里插入图片描述

ADT抽象数据类型名{
	数据对象:<数据对象的定义>
	数据关系:<数据关系的定义>
	基本操作:<基本操作的定义>
} ADT抽象数据类型名

抽象数据类型的主要作用是数据封装和信息隐藏,让实现与使用相分离。数据及其相关操作的结合称为数据封装。对象可以对其他对象隐藏某些操作细节,从而使这些操作不会受到其他对象的影响,这就是信息隐藏。抽象数据类型独立于运算的具体实现,使用户程序只能通过抽象数据类型定义的某些操作来访问其中的数据,实现了信息隐藏。

2 算法复杂度

我们对好的算法的评判标准主要是高效性、低存储性

  • 高效性:指算法运行效率高,即算法运行所消耗的时间短。我们用算法基本运算的执行次数来衡量算法的效率。因此将算法基本运算的执行次数作为时间复杂度的度量标准。

  • 低存储性:指算法所需要的存储空间低。算法占用的空间大小称为空间复杂度

时间复杂度
算法运行需要的时间,一般将算法基本运算的执行次数作为时间复杂度的度量标准。

我们用 O ( f ( n ) ) O(f (n)) O(f(n))来表示时间复杂度渐近上界
Ω ( f ( n ) ) Ω(f (n)) (f(n))来表示时间复杂度渐近下界
Θ ( f ( n ) ) Θ(f (n)) Θ(f(n))来表示时间复杂度渐近精确界

衡量算法的好坏通常会考查算法的最坏情况,我们通常使用时间复杂度渐近上界 O ( f ( n ) ) O(f (n)) O(f(n))来表示时间复杂度。

常见时间复杂度函数曲线:
在这里插入图片描述
它们之间的关系如下:
O ( 1 ) < O ( l o g n ) < O ( n ) < O ( n l o g n ) < O ( n 2 ) < O ( n 3 ) < O ( 2 n ) < O ( n ! ) < O ( n n ) O(1)< O(logn)< O(n)< O(nlogn)< O(n^2)< O(n^3)< O(2^n) < O(n! )< O(n^n) O(1)O(logn)O(n)O(nlogn)O(n2)O(n3)O(2n)O(n!)O(nn)

空间复杂度
算法占用的空间大小。一般将算法的辅助空间作为衡量空间复杂度的标准。

  • 空间复杂度只计算辅助空间。
  • 递归算法的空间复杂度要计算递归使用的栈空间。

本文内容摘自《趣学数据结构》作者:陈小玉,详细内容可查看原版书籍