种豆资源网

当前位置:首页 > 百科 > 百科综合 / 正文

广义数据结构

(2019-09-06 20:01:45) 百科综合
广义数据结构

广义数据结构

从字面上来看,广义数据结构就是指数据问的相互关係。具体到计算机环境时,广义数据结构,就是由某种逻辑关係组织起来的一批数据,按一定的存储方法被存储于计算机中,并在这些数据上定义了一个运算的集合。

基本介绍

  • 中文名:广义数据结构
  • 外文名:GDS;generalized data structure
  • 实质:指数据问的相互关係
  • 常见结构:数组、柞、伫列、鍊表、树、图等
  • 三个侧面:数据的逻辑结构、存储结构和运算
  • 套用领域:计算机科学、教育学、套用经济学

概述

从字面上来看,广义数据结构就是指数据问的相互关係。具体到计算机环境,谈到任何一种结构时,都自然地联繫着作用在这种类型的数据上的运算(即函式),为了在计算机上执行这些运算,我们有必要把这些数据以某种方式存储在计算机中。因此,我们可以认为,所谓广义数据结构,就是由某种逻辑关係组织起来的一批数据,按一定的存储方法被存储于计算机中,并在这些数据上定义了一个运算的集合。也就是说,数据结构具有三个方面:数据的逻辑结构、数据的存储结构和数据的运算。

逻辑结构

常见逻辑关係有:线性结构、树形结构、图结构和档案结构。其中,线性结构是最简单的数据结构,例如,程式设计语言中往往都会介绍的线性表(包括数组和鍊表)、栈、伫列、向量、字元串等。其中,字元串就是每个结点都是单个字元的线性表。实际上多维数组和广义表也是线性结构的推广。另外,档案其本质也是线性结构。不过由于存储在外存中.对档案数据的访问速度非常慢。因此,仔细研究档案结构和基于档案的外排序也是很有必要的。
二叉树和树是非常重要的数据结构,其套用十分灵活而广泛。二叉树可以看作是树的特例。例如,语言编译中要用到语法树,作业系统有目录树。资料库系统需要用索引树等进行数据管理,而在人工智慧领域,需要用到搜寻树等。许多真实世界的问题都可以用图来抽象地定义。例如,一张交通图可以用数据结构的图来形象化地表示:用结点表示城市,用边表示连线城市的高速公路;Web网页的关係也可以表示为图:Web网页作为结点,网页之间的连结作为边。图是一种最通用的逻辑结构,实际上,线性表∈叉树∈树∈图。

存储结构

常见的存储方法有:顺序方法、连结方法、索引方法、散列方法。其中,索引存储又分为线性和树形两种。档案结构的索引则往往用树形结构。

运算

对于一种数据结构,往往需要定义一些运算。例如,建立数据结构,清除数据结构、插入一个新数据元素.删除某个数据元素、修改某个数据元素、排序、检索等。作为最常用的算法.排序和检索历来是数据结构讨论中的重点问题。排序算法最能够体现算法的魅力,它对算法速度要求非常高,其中内排序主要考虑的是怎样减少关键码之间的比较次数和记录交换次数,以提高排序速度。可以证明所有基于比较的排序算法的时间代价是Θ(nIogn),这也是排序问题的时间代价。而外排序则考虑外存的特性,儘量减少访外操作,以提高排序速度。检索则考虑怎样提高检索速度,这往往是与存储方法有关的。例如,我们可以利用索引存储来加快检索。散列表、B树和B+树等高效的数据结构都具有极好的检索性能。

套用领域

数据结构是计算机学科的重要分支研究领域。数据结构和算法在计算机学科中的地位十分重要,其他计算机科学领域及有关的套用软体都要使用到各种数据结构。数据结构是算法分析与设计、作业系统、软体工程、资料库概论、编译技术、计算机图形学、人机互动等专业基础课和专业课程的先行课程。语言编译要使用栈、散列表及语法树;作业系统中用伫列、存储管理表及目录树等;资料库系统运用线性表、多鍊表及索引树等进行数据管理:而在人工智慧领域,依求解问题性质的差异将涉及到各种不同的数据结构,如广义表、集合、搜寻树及各种有向图等等。

抽象数据类型

事实上,数据结构的三个侧面,以数据的逻辑结构和数据的运算定义更为重要。因为很多时候人们并不关心数据的存储结构和运算的具体实现。1983年Aho等人把数据结构的存储与实现细节剥离,定义了抽象数据类型(简称“ADT“)的概念。抽象数据类型是定义了一组运算的数学模型。例如栈结构,栈中元素的数学特性(即逻辑结构)表现为线性表,它们是有序的;栈的主要运算是进栈(push)、出栈(pop)、判栈空(isEmpty)等。这里我们并不涉及栈的存储方式以及栈中元素的类型等。这种抽象的数据类型可以在较高级的算法中直接引用,而不用考虑它的实现细节。这就使得设计者可以在不同的设计阶段採用不同的抽象数据类型作为设计的基础.在适当的抽象层次上考虑程式的结构和算法,从而很好地支持了逻辑设计和物理实现的分离,支持封装和信息隐蔽。

常用数据结构

数组

在程式设计中,为了处理方便, 把具有相同类型的若干变数按有序的形式组织起来。这些按序排列的同类数据元素的集合称为数组。在C语言中, 数组属于构造数据类型。一个数组可以分解为多个数组元素,这些数组元素可以是基本数据类型或是构造类型。因此按数组元素的类型不同,数组又可分为数值数组、字元数组、指针数组、结构数组等各种类别。

是只能在某一端插入和删除的特殊线性表。它按照先进后出的原则存储数据,先进入的数据被压入栈底,最后的数据在栈顶,需要读数据的时候从栈顶开始弹出数据(最后一个数据被第一个读出来)。

伫列

一种特殊的线性表,它只允许在表的前端(front)进行删除操作,而在表的后端(rear)进行插入操作。进行插入操作的端称为队尾,进行删除操作的端称为队头。伫列是按照“先进先出”或“后进后出”的原则组织数据的。伫列中没有元素时,称为空伫列。

鍊表

是一种物理存储单元上非连续、非顺序的存储结构,它既可以表示线性结构,也可以用于表示非线性结构,数据元素的逻辑顺序是通过鍊表中的指针连结次序实现的。鍊表由一系列结点(鍊表中每一个元素称为结点)组成,结点可以在运行时动态生成。每个结点包括两个部分:一个是存储数据元素的数据域,另一个是存储下一个结点地址的指针域。

是包含n(n>0)个结点的有穷集合K,且在K中定义了一个关係N,N满足 以下条件:
(1)有且仅有一个结点 K0,他对于关係N来说没有前驱,称K0为树的根结点。简称为根(root)。  (2)除K0外,K中的每个结点,对于关係N来说有且仅有一个前驱。
(3)K中各结点,对关係N来说可以有m个后继(m>=0)。

图是由结点的有穷集合V和边的集合E组成。其中,为了与树形结构加以区别,在图结构中常常将结点称为顶点,边是顶点的有序偶对,若两个顶点之间存在一条边,就表示这两个顶点具有相邻关係。

在计算机科学中,堆是一种特殊的树形数据结构,每个结点都有一个值。通常我们所说的堆的数据结构,是指二叉堆。堆的特点是根结点的值最小(或最大),且根结点的两个子树也是一个堆。

散列表

若结构中存在关键字和K相等的记录,则必定在f(K)的存储位置上。由此,不需比较便可直接取得所查记录。称这个对应关係f为散列函式(Hash function),按这个思想建立的表为散列表。

标 签

搜索
随机推荐

Powered By 种豆资源网||