数据结构课程设计的报告:电文编码译码(哈夫曼编码).docx
福建农林大学计算机与信息学院数据构造课程设计设计:哈夫曼编译码器姓名:韦邦权专业:2013级计算机科学与技术学号:13224624班级:13052316完成日期:2013.12.28哈夫曼编译码器一、需求分析在当今信息爆炸时代,如何采用有效的数据压缩技术节省数据文件的存储空间和计算机网络的传送时间已越来越引起人们的重视,哈夫曼编码正是一种应用广泛且非常有效的数据压缩技术。哈夫曼编码是一种编码方式,以哈夫曼树一即最优二叉树,带权路径长度最小的二叉树,经常应用于数据压缩。哈夫曼编码使用一张特殊的编码表将源字符(例如某文件中的一个符号)进展编码。这张编码表的特殊之处在于,它是根据每一个源字符出现的估算概率而建设起来的(出现概率高的字符使用较短的编码,反之出现概率低的那么使用较长的编码,这便使编码之后的字符串的平均期望长度降低,从而到达无损压缩数据的目的)。哈夫曼编码的应用很广泛,利用哈夫曼树求得的用于通信的二进制编码称为哈夫曼编码。树中从根到每个叶子都有一条路径,对路径上的各分支约定:指向左子树的分支表示“0码,指向右子树的分支表示“1码,取每条路径上的“0或”1的序列作为和各个叶子对应的字符的编码,这就是哈夫曼编码。哈夫曼译码输入字符串可以把它编译成二进制代码,输入二进制代码时可以编译成字符串。二、设计要求对输入的一串电文字符实现哈夫曼编码,再对哈夫曼编码生成的代码串进展译码,输出电文字符串。通常我们把数据压缩的过程称为编码,解压缩的过程称为解码。电报通信是传递文字的二进制码形式的字符串。但在信息传递时,总希望总长度能尽可能短,即采用最短码。假设每种字符在电文中出现的次数为Wi,编码长度为Li,电文中有n种字符,那么电文编码总长度为WiLi°假设将此对应到二叉树上,Wi为叶结点的权,Li为根结点到叶结点的路径长度。那么,ETViLi恰好为二叉树上带权路径长度。因此,设计电文总长最短的二进制前缀编码,就是以n种字符出现的频率作权,构造一棵哈夫曼树,此构造过程称为哈夫曼编码。设计实现的功能:(1)哈夫曼树的建设;(2)哈夫曼编码的生成;(3)编码文件的译码。三、概要设计哈夫曼编译码器的主要功能是先建设哈夫曼树,然后利用建好的哈夫曼树生成哈夫曼编码后进展译码。在数据通信中,经常需要将传送的文字转换成由二进制字符0、1组成的二进制串,称之为编码。构造一棵哈夫曼树,规定哈夫曼树中的左分之代表0,右分支代表1,那么从根节点到每个叶子节点所经过的路径分支组成的0和1的序列便为该节点对应字符的编码,称之为哈夫曼编码。最简单的二进制编码方式是等长编码。假设采用不等长编码,让出现频率高的字符具有较短的编码,让出现频率低的字符具有较长的编码,这样可能缩短传送电文的总长度。哈夫曼树课用于构造使电文的编码总长最短的编码方案。设计包含的几个方面:哈夫曼树的建设赫夫曼树的建设由赫夫曼算法的定义可知,初始森林中共有n棵只含有根结点的二叉树。算法的第二步是:将当前森林中的两棵根结点权值最小的二叉树,合并成一棵新的二叉树;每合并一次,森林中就减少一棵树,产生一个新结点。显然要进展n1次合并,所以共产生n-1个新结点,它们都是具有两个孩子的分支结点。由此可知,最终求得的哈夫曼树中一共有2n-l个结点,其中n个结点是初始森林的n个孤立结点。并且哈夫曼树中没有度数为1的分支结点。我们可以利用一个大小为2n-l的一维数组来存储赫夫曼树中的结点。定义的构造体类型如下:typedefstructchar data;int weight;int parent;int !child;结点字符权值双亲结点左孩子结点intrchild;右孩子结点)HTNode;哈夫曼编码要求电文的哈夫曼编码,必须先定义哈夫曼编码类型,根据设计要求和实际需要定义的类型如下:typedetstruct(charcdN;/存放编码的数组intstart;/从start开场读Cd中的哈夫曼编码)Hcode;/编码构造体类型代码文件的译码译码的基本思想是:读文件中编码,并与原先生成的哈夫曼编码表比较,遇到相等时,即取出其对应的字符存入一个新串中。四、详细设计字符统计intjsq(char*s,intcnt,charstr)char*p;inti,j,k;for(i=l;i<=256;i+)cnti=0;for(p=s;*p!="O'p+)(k=*p;cntk+;)j=0;for(i=l,j=0;i<=256;i+)if(cnti!=O)(j+;)returnj;)哈夫曼树的算法voidCreateHT(HTNodeht4ntn,charstr4ntcn)创立哈夫曼树函数fbr(intinput=1;input<=256;input+)strinut=input;int1=0;for(intoutput=I;output<=256;output+)if(cnoutput!=0)(htlJ.data=stroutput;的字母依次存入数组hthtl.weight=cnoutputj;1+;按字母顺序将出现inti,k,Inode,mode;intminl,min2;for(i=0;i<2*n-l;i+)hti.parent=htli.lchild=hti.rchild=O;for(i=n;i<2*n-l;i+)(minl=min2=MAX;lnode=mode=0;for(k=O;k<=i-l;k+)(if(htk.parent=O)(if(htk.weight<min1)min2=minI;rnode=lnode;所有结点的相关域置初值O构造哈夫曼树/int的范围是-32768-32767/Inode和mode记录最小权值的两个结点位置选出每次外层循环最小权值的两个结点只在尚未构造二叉树的结点中查找比mini小时min1=htk.weight;lnode=k;elseif(htk.weight<min2)比mini大,比min2小min2=htk.weight;mo<ie=k;htlnode.parent=i;htrnode.parent=i;hti.weight=htlnode.weight+htrnode.weight;为两个最小节点权值之和hti.lchild=lnode;hti.rchild=rnode;1)哈夫曼编码voidCreateHCode(HTNodehtl,HCodehcd,intn)两个最小节点的父节点是i两个最小节点的父节点权值父节点的左节点和右节点inti,p,c;HCodehe;for(i=0;i<n;i+)根据哈夫曼树求哈夫曼编码hc.start=n;初始位置c=i;从叶子结点hti开场上溯p=htij.parent;while(p!=0)循序直到树根结点完毕循环(hc.cdhc.start-=(htp.lchild)=c7,O,f;左孩子记为0,右孩子记为1c=p;p=htp.parent;与上句c=i;p=hti.parent同义,促进循环Ihc.start+;/start指向哈夫曼编码hc.cd中最开场字符hcdij=hc;)哈夫曼译码voiddeHCode(HTNodeht,HCodehcd,intn,charstr)译码函数(Printf("输出译码结果为:);inti,j,k,x,m=O;charcodeMAX;for(i=0;i<MAX;i+)for(j=O;j<n;j+)if(stri=htj.data)循环查找与输入字符一样的编号,一样的就输出这个字符的编码(for(k=hcdj.start;k<=n;k+)(codelm=hcdj.cdk;将输出的编码赋值到数组中m+;)break;输出完成后跳出当前for循环)codem-#'/把要进展译码的字符串存入code数组中while(code0!='#*)for(i=0;i<n;i+)(m=0;/m为想同编码个数的计数器for(k=hcdi.start,j=O;k<=n;k+,j+)/j为记录所存储这个字符的编码个数(if(codej=hcdi.cdk)当有一样编码时m值加Im+;if(m=j)串个数相等时那么输出这个的data数据 (printf(',%c'hti.data);for(x=0;codex-j!-#,;x+) 删除(codex=codex+j;当输入的字符串与所存储的编码字符把已经使用过的Code数组里的字符串删除j个数,往前移动j位printf(,n");)主函数voidmain()(charstMAX,sstMAX;intcn257;intn,i;Prindr请输入字符串(任意字符gets(st);n=jsq(st,cn,sst);Illllllllllllllllllllllllimfor(i=0;i<99;i+)ssti=sti;IlllllHllllllHlinilllllllIIIIIIHTNodehtM;HCodehcdN;CreateHT(ht,n,st,cn);CreateHCode(ht,hcd,n);outputHCode(ht,hcd,n);editHCode(ht,hcd,n,sst);deHCode(ht,hcd,n,sst);)五、调试输出哈夫曼编码输出编码结果输出译码结果附录源程序#include<stdio.h>#include<string.h>#defineN256#defineM2*N-l/gets。函数需要义用N表示50叶节点数用M表示节点总数当叶节点数位n时总节点数为2n-l#defineMAX32767typedefstructchardata;intweight;intparent;int!child;intrchild;)HTNode;结点字符权值双亲结点左孩子结点右孩子结点IiiiiiiiiiiiiiiiiiiiiiiiiiitypedefstructcharcdN;intstart;HCode;存放哈夫曼码从start开场读Cd中的哈夫曼码Illlllllllllllllllllllllllllllinilintjsq(char*s,intcnt,charstr)char*p;inti,j,k;for(i=l;i<=256;i+)cnti=O;fbr(p=s;*p!="O'p+)(k=*p;cntk+;)j=O;for(i=l,j=0;i<=256;i+)if(cnti!=0)(j+;)returnj;创立哈夫曼树函数IiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiivoidCreateHT(HTNodehtjntn,charstrjntcn)(for(intinput=1;input<=256;input+)strinput=input;int1=0;fr(intoutput=I;output<=256;output+)(if(cnoutput!=0)按字母顺序将出现htl.data=stroutput;的字母依次存入数组hthtlj.weight=cnoutput;1+;)1inti,k,Inode,mode;for (i=0i<2*n-l ;i+)hti.parent=htliJ.lchild=hti.rchild=O;for (i=n;i<2*n-l ;i+) (min 1 =min2=MAX;lnode=mode=0;for (k=O;k<=i-l;k+) (if (htk.parent=O)(if (htk.weight<min 1)intminl,min2;/所有结点的相关域置初值0构造哈夫曼树/int的范围是-32768-32767/Inode和mode记录最小权值的两个结点位置选出每次外层循环最小权值的两个结点只在尚未构造二叉树的结点中查找比mini小时min2=min1;rnode=lnode;min1=htk.weight;lnode=k;elseif(htkj.weight<min2)比mini大,比min2小两个最小节点的父节点是i 两个最小节点的父节点权值父节点的左节点和右节点min2=htk.weight;mo<ie=k;htlnode.parent=i;htrnode.parent=i;htij.weight=htlnodej.weight+htmode.weight;为两个最小节点权值之和htij.lchild=lnode;htij.rchild=rnode;IllllllllllllllllinilllllllllllllHllllllHllllIIIIIIvoidCreateHCode(HTNodeht,HCodehcd,intn)mt,p,c;HCodehe;for(i=0;i<n;i+)/根据哈夫曼树求哈夫曼编码(hc.start=n;初始位置c=i;从叶子结点hti开场上溯p=hti.parent;while (p!=0) (hc.cdhc.start-=(htp.lchild)-c7'0,f;子记为1 c=p;p=htpj.parent;1hc.start+;hcdi=hc;) ) IHnillllllHllHiuillllllllinilllHllIIIIIIH void outputHCode(HTNode ht,HCode hcd,int n) (int i,k;printf("输出哈夫曼编码:n“);for (i=0;i<n;i+)(printf(,' %c:t",htij.data);for (k=hcdi.start;k<=n;k+)(printf("%c",hcdi.cdk);1printf("n'');循序直到树根结点完毕循环左孩子记为0,右孩IllllllllllllllllinilllllllllllllHIIIIIIHvoid editHCode(HTNode ht,HCode hcdJnt n,char str) (int i,j,k;rintf(,n输出编码结果:n");for (i=0;i<MAX;i+)for (j=O;j<n;j+)if(stri=htj.data)输出这个字符的编码与上句c=i;p=hti.parent同义,促进循环/start指向哈夫曼编码hc.cd中最开场字符输出哈夫曼编码的列表/输出data中的所有数据,输出所有data中数据的编码从初最开场的字符起输出编码函数循环查找与输入字符一样的编号,一样的就for(k=hcdjj.start;k<=n;k+)printf(',%c",hcdj.cdk);)break;输出完成后跳出当前for循环)printf(,n);)voiddeHCode(HTNodeht,HCodehcd,intn,charstr)译码函数(PrindV输出译码结果为:n");intij,k,x,m=0;charcodeMAX;for(i=0;i<MAX;i+)for(j=O;j<n;j+)if(stri=htj.data)循环查找与输入字符一样的编号,一样的就输出这个字符的编码(for(k=hcdj.start;k<=n;k+)(codelm=hcdj.cdk;将输出的编码赋值到数组中m+;)break;输出完成后跳出当前for循环)codem-#'/把要进展译码的字符串存入code数组中while(code0!='#*)for(i=0;i<n;i+)m=0;for (k=hcdi.start,j=O;k<=n;k+,j+) (if(codej=hcdi .cdk) m+;)if(m=j)串个数相等时那么输出这个的data数据(printf(',%c'hti.data);for(x=0;codex-j! - #*;x+)m为想同编码个数的计数器/j为记录所存储这个字符的编码个数当有一样编码时m值加1当输入的字符串与所存储的编码字符把己经使用过的code数组里的字符串删除codexj=codex+jj;删除j个数,往前移动j位printf(',n");Iiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiivoidmain()(charstMAX,sstMAX;intcn257;intn,i;PrindC请输入字符串(任意字符gets(st);n=jsq(st,cn,sst);Illllllllllllllllllllllllimfor(i=0;i<99;i+)ssti=sti;IlllllHinillllllllllllllllIIIIIIHTNodehtM;HCodehcdN;CreateHT(ht,n,st,cn);CreateHCode(ht,hcd,n);outputHCode(ht,hcd,n);editHCode(ht,hcd,n,sst);deHCode(ht,hcd,n,sst);