清华大学严蔚敏版数据结构考研要点(精华版).docx
《清华大学严蔚敏版数据结构考研要点(精华版).docx》由会员分享,可在线阅读,更多相关《清华大学严蔚敏版数据结构考研要点(精华版).docx(21页珍藏版)》请在课桌文档上搜索。
1、1、数据(Data):是客观事物的符号表示。在计算机科学中指的是所有能输入到计算机中并被计算机程序处理的符号的总称。数据元素(DataEIement):是数据的根本单位,在程序中通常作为一个整体来进行考虑和处理。一个数据元素可由假设十个数据项(DataItem)组成。数据项是数据的不可分割的最小单位。数据项是对客观事物某一方面特性的数据描述。数据对象(DataObject):是性质相同的数据元素的集合,是数据的一个子集。如字符集合C=7V;B:C,.。数据结构(DataStrUCtUre):是指相互之间具有(存在)一定联系(关系)的数据元素的集合。元素之间的相互联系(关系)称为逻辑结构。数据元
2、素之间的逻辑结构有四种根本类型,如图1-3所示。集合:结构中的数据元素除了“同属于一个集合”外,没有其它关系。线性结构:结构中的数据元素之间存在一对一的关系。树型结构:结构中的数据元素之间存在一对多的关系。图状结构或网状结构:结构中的数据元素之间存在多对多的关系。2、顺序结构:数据元素存放的地址是连续的:链式结构:数据元素存放的地址是否连续没有要求。数据的逻辑结构和物理结构是密不可分的两个方面,一个算法的设计取决于所选定的逻辑结构,而算法的实现依赖于所采用的存储结构。在C语言中,用一维数组表示顺序存储结构;用结构体类型表示链式存储结构。3、C语言中用带指针的结构体类型来描述typedefstr
3、uctLnodeEIemTypedata;/*数据域,保存结点的值*/structLnode*next;/*指针域*/LNode;/*结点的类型*/4、循环队列为空:front=rear。循环队列满:(rear+l)%MAX_QUEUE_SIZE=fronto5、性质1,在非空二叉树中,第i层上至多有21个结点(iMl)性质2:深度为k的二叉树至多有2匕1个结点(kl)o性质3:对任何一棵二叉树,假设其叶子结点数为11o,度为2的结点数为n2,那么n0=112+lo一棵深度为k且有2k-l个结点的二叉树称为满二叉树(FUllBinaryTree)0完全二叉树的特点:假设完全二叉树的深度为k,那
4、么所有的叶子结点都出现在第k层或k-1层。对于任一结点,如果其右子树的最大层次为/,那么其左子树的最大层次为/或/+Io性质4:n个结点的完全二叉树深度为:IJogznWlo性质5:假设对一棵有n个结点的完全二叉树(深度为g2n+l)的结点按层(从第1层到第UogznjU层)序自左至右进行编号,那么对于编号为i(IWiWn)的结点:假设i=l:那么结点i是二叉树的根,无双亲结点;否那么,假设il,那么其双亲结点编号是Li启。如果2in:那么结点i为叶子结点,无左孩子;否那么,其左孩子结点编号是2i。如果2i+ln:那么结点i无右孩子;否那么,其右孩子结点编号是2i+l.6、线索二叉树:设一棵二
5、叉树有n个结点,那么有n-1条边(指针连线),而n个结点共有2n个指针域(LChild和RChiId),显然有n+1个空闲指针域未用,那么可以利用这些空闲的指针域来存放结点的直接前驱和直接后继信息。7、HUffman树:具有n个叶子结点(每个结点的权值为Wi)的二叉树不止一棵,但在所有的这些二叉树中,必定存在一棵WPL值最小的树,称这棵树为HUffman树(或称最优树)。8、完全无向图:对于无向图,假设图中顶点数为n,用e表示边的数目,那么e0,n(n-l)2。具有n(n-l)2条边的无向图称为完全无向图。完全有向图:对于有向图,假设图中顶点数为n,用e表示弧的数目,那么ew0,n(n-l)。
6、具有n(n-l)条边的有向图称为完全有向图。生成树、生成森林:一个连通图(无向图)的生成树是一个极小连通子图,它含有图中全部n个顶点和只有足以构成一棵树的nl条边,称为图的生成树关于无向图的生成树的几个结论:1)一棵有n个顶点的生成树有且仅有nl条边;2)如果一个图有n个顶点和小于n-1条边,那么是非连通图:3)如果多于nl条边,那么一定有环:4)有n-1条边的图不一定是生成树。9、最小生成树(MinimUmSPanningTree):带权连通图中代价最小的生成树称为最小生成树。最小生成树在实际中具有重要用途,如设计通信网。设图的顶点表示城市,边表示两个城市之间的通信线路,边的权值表示建造通信
7、线路的费用。n个城市之间最多可以建n(n-l)2条线路,如何选择其中的n-1条,使总的建造费用最低?10、工程完成最短时间:从起点到终点的最长路径长度(路径上各活动持续时间之和)。长度最长的路径称为关键路径,关键路径上的活动称为关键活动。关键活动是影响整个工程的关键。5MB7.2甭Rlr6施及工舞桂中住11、查找方法比拟顺序查找折半查找分块查找12、在随机情况下,二叉排序树ASL最大最小两者之间表结构有序表、无序表有序表分块有序表的平均查找长度ASL和蜘(n)(树存储结构顺序存储结构线性链表顺序存储结构顺序存储结构线性链表的深度)是等数量级的。二叉排序树(BinarySOrtTree或Bina
8、rySearChTree)的定义为:二叉排序树或者是空树,或者是满足以下性质的二叉树。(1):假设左子树不为空,那么左子树上所有结点的值(关键字)都小于根结点的值;(2):假设右子树不为空,那么右子树上所有结点的值(关键字)都大于根结点的值;(3):左、右子树都分别是二叉排序树。结论:假设按中序遍历一棵二叉排序树,所得到的结点序列是一个递增序列。13、平衡二叉树或者是空树,或者是满足以下性质的二叉树。:左子树和右子树深度之差的绝对值不大于1;:左子树和右子树也都是平衡二叉树。平衡因子(BalanCeFaCtor):二叉树上结点的左子树的深度减去其右子树深度称为该结点的平衡因子。平衡二叉排序树上
9、进行查找的平均查找长度和m2n是一个数量级的,平均时间复杂度为0(2n)四种平衡化旋转,其正确性容易由遍历所得中序序列不变来证明。并且,无论是哪种情况,平衡化旋转处理完成后,形成的新子树仍然是平衡二叉排序树,且其深度和插入前以a为根结点的平衡二叉排序树的深度相同。所以,在平衡二叉排序树上因插入结点而失衡,仅需对失衡子树做平衡化旋转处理。14、一棵m阶B一树,或者是空树,或者是满足以下性质的m叉树:根结点或者是叶子,或者至少有两棵子树,至多有m棵子树;除根结点外,所有非终端结点至少有lml棵子树,至多有m棵子树;所有叶子结点都在树的同一层上;(4)每个结点应包含如下信息:(n,Ao,Ki,Ai,
10、K2,A?,,KA)其中Ki(lin)是关键字,且KiK+(lin-l);Ai(i=O,1,.,n)为指向孩子结点的指针,且Ajr所指向的子树中所有结点的关键字都小于Ki,Ai所指向的子树中所有结点的关键字都大于Ki;n是结点中关键字的个数,且Lm2,lnm-l,n+1为子树的棵数。根据m阶B_树的定义,第一层上至少有1个结点,第二层上至少有2个结点;除根结点外,所有非终端结点至少有m/2旗子树,,第h层上至少有Tm/ZF个结点。在这些结点中,根结点至少包含1个关键字,其它结点至少包含m/2k个关键字,&s=m2l那么总的关键字数目n满足,f(7耍,、J22”因此有:hl+s(n+l)Z)=l
11、+m21(n+l)Z)即在含有n个关键字的B举上进行查找时,从根结点到待查找记录关键字的结点的路径上所涉及的结点数不超过1+m(n+l)启)o15、m阶B树。它与B_树的主要不同是叶子结点中存储记录。在树中,所有的非叶子结点可以看成是索引,而其中的关键字是作为“分界关键字,用来界定某一关键字的记录所在的子树。一棵)阶夕树与m阶B一树的主要差异是:(1)假设一个结点有n棵子树,那么必含有n个关键字;所有叶子结点中包含了全部记录的关键字信息以及这些关键字记录的指针,而且叶子结点按关键字的大小从小到大顺序链接;所有的非叶子结点可以看成是索引的局部,结点中只含有其子树的根结点中的最大(或最小)关键字。
12、16、哈希函数:在记录的关键字与记录的存储地址之间建立的一种对应关系叫哈希函数。哈希函数是一种映象,是从关键字空间到存储地址空间的一种映象。可写成:addr(ai)=H(ki),其中i是表中一个元素,addr(ai)是ai的地址,K是ai的关键字。哈希表:应用哈希函数,由记录的关键字确定记录在表中的地址,并将记录放入此地址,这样构成的表叫哈希表。哈希查找(又叫散列查找):利用哈希函数进行查找的过程叫哈希查找。例1.设散列表长为7,记录关键字组为:15,14,28,26,56,23,散列函数:H(key)=keyMOD7,冲突处理采用线性探测法。解:H(15)=15MOD7=1H(14)=14M
13、OD7=0H(28)=28MOD7=0冲突H1(28)=l又冲突Hz(28)=2H(26)=26MOD7=5H(56)=56MOD7=0冲突H1(56)=l又冲突H2(56)=2又冲突H3(56)=3H(23)=23MOD7=2冲突H1(23)=3又冲突H3(23)=4次中均入的记录败各种散列函数所构造的散列表的ASl如下:“M土”J17、排序的稳定性假设记录序列中有两个或两个以上关键字相等的记录:Ki=Kj(ij,i,j=l,2,.n),且在排序前Ri先于Rj(ij),排序后的记录序列仍然是Ri先于Rj,称排序方法是稳定的,否那么是不稳定的。排序的分类待排序的记录数量不同,排序过程中涉及的存
14、储器的不同,有不同的排序分类。待排序的记录数不太多:所有的记录都能存放在内存中进行排序,称为内部排序;待排序的记录数太多:所有的记录不可能存放在内存中,排序过程中必须在内、外存之间进行数据交换,这样的排序称为外部排序。18、插入排序采用的是以“玩桥牌者的方法为根底的。即在考察记录Ri之前,设以前的所有记录Ri,R2Rii已排好序,然后将Ri插入到已排好序的诸记录的适当位置。最根本的插入排序是直接插入排序(StraightInsertionSort)o(1)最好情况,假设待排序记录按关键字从小到大排列(正用,算法中的内循环无须执行,那么一趟排序时:关键字比拟次数1次,记录移动次数2次(2)最坏情
15、况:假设待排序记录按关键字从大到小排列(逆用,那么一趟排序时:算法中的内循环体执行a关键字比拟次数i次,记录移动次数i+T.一般地,认为待排序的记录可能出现的各种排列的概率相同,那么取以上两种情况的平均值,作为排序的关键字比拟次数和记录移动次数,约为标4那么复杂度为。(四。算法实现voidstraightJnsert_sort(Sqlist*L)intij;for(i=2;ilength;i+)L-RO=L-Rijj=i-l;*设置哨兵*/while(LT(L-R0.key,L-Rj.key)L-Ri+l=L-Rj;H*查找插入位置*/1.-RU+1=L-RO;/*插入到相应位置*/)=步*菽
16、入排序当将待排序的记录RUl插入到已排好序的记录子表RlTill中时,由于RLR2,Rc已排好序,那么查找插入位置可以用“折半查找,实现,那么直接插入排序就变成为折半插入排序。从时间上比拟,折半插入排序仅仅减少了关键字的比拟次数,却没有减少记录的移动次数,故时间复杂度仍然为。排序例如:设有一组关键字30,13,70,85,39,42,6,20,采用折半插入排序方法排序的过程1=工30)37085394NG20i=N工3,703942GNOi=7NoI=20339f427020Iiuli三li=820cf13T3?394270SS)20Iowmi4N708SNolowI11miB三I=8NO53
17、NO30394N70ION匕斤十用;八月RYjJ才呈算法实现voidBinaryJnsert_sort(Sqlist*L)inti,j,low,high,mid;for(i=2;ilength;i+)L-RO=L-Ri;*设置哨兵*/Iow=I;high=i-l;while(lowRO.key,L-Rmid.key)high=mid-l;elselow=mid+l;)*查找插入位置*/for(j=i-l;j=hgh+l;j-)1.-Rj+l=L-Rj;1.-Rh!gh+l=L-RO;*插入到相应位置*/=2路插入排序排序例如:设有初始关键字集合49,38,65,13,97,27,76,采用2-
18、路插入排序的过程first图10-32-路插入排序过程例:设有关键字集合49,38,65,97,76,13,27,49,采用表插入排序的过程=希尔排序(ShellSort,又称缩小增量法)是一种分组插入排序方法。排序例如设有10个待排序的记录,关健字分别为9,13,8,2,5,玛7,1,15,11,增量序列是5,3,1,希尔排序的过程:算法实现先给出一趟希尔排序的算法,类似直接插入排序。voidshell-pass(Sqlist*L,intd)/*对顺序表L进行一趟希尔排序,增量为d*/ntj,k;for(j=d+l;jlength;j+)L-R0=L-RU;/*设置监视哨兵*/k=j-d;w
19、hile(k088LT(L-R0.keL-Rk.key)L-Rk+d=L-Rk;k=k-d;1.-Rk+j=L-RO;)voidshelI-sort(Sqlist*L,intdk,intt)/*按增量序列dkO.t-l,对顺序表L进行希尔排序*/intm;for(m=0;m=t;m+)ShILPaSs(L,dkm);)=冒泡排序排序例如:设有9个待排序的记录,关键字分别为23,38,22,45,里,67,31,15,41,冒泡排序的过程:voidBubble-Sort(Sqlist*L)intj,k,flag;for(j=0;jlength;j+)*共有n-1趟排序*/flag=TRUE;fo
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 清华大学 严蔚敏版 数据结构 考研 要点 精华版
链接地址:https://www.desk33.com/p-1246806.html