欢迎来到课桌文档! | 帮助中心 课桌文档-建筑工程资料库
课桌文档
全部分类
  • 党建之窗>
  • 感悟体会>
  • 百家争鸣>
  • 教育整顿>
  • 文笔提升>
  • 热门分类>
  • 计划总结>
  • 致辞演讲>
  • 在线阅读>
  • ImageVerifierCode 换一换
    首页 课桌文档 > 资源分类 > DOCX文档下载  

    pl0语法分析词法分析语义分析.docx

    • 资源ID:1081607       资源大小:137.35KB        全文页数:69页
    • 资源格式: DOCX        下载积分:5金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要5金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    pl0语法分析词法分析语义分析.docx

    作者:IoVe冥天出处:PL/0语言是Pascal语言的一个子集,我们这里分析的PL/0的编译程序包括了对PL/0语言源程序进行分析处理、编译生成类PCODE代码,并在虚拟机上解释运行生成的类PCODE代码的功能。PL/0语言编译程序采用以语法分析为核心、一遍扫描的编译方法。词法分析和代码生成作为独立的子程序供语法分析程序调用。语法分析的同时,提供了出错报告和出错恢复的功能。在源程序没有错误编译通过的情况下,调用类PCODE解释程序解释执行生成的类PCODE代码。词法分析子程序分析:词法分析子程序名为getsym,功能是从源程序中读出一个单词符号(token),把它的信息放入全局变量SynLid和num中,语法分析器需要单词时,直接从这三个变量中获得。(注意!语法分析器每次用完这三个变量的值就立即调用getsym子程序获取新的单词供下一次使用。而不是在需要新单词时才调用getsymiS程。)getsym过程通过反复调用getch子过程从源程序过获取字符,并把它们拼成单词。getch过程中使用了行缓冲区技术以提高程序运行效率。词法分析器的分析过程:调用getsym时,它通过getch过程从源程序中获得一个字符。如果这个字符是字母,那么继续获取字符或数字,最终可以拼成一个单词,查保存字表,如果查到为保存字,那么把Sym变量赋成相应的保存字类型值;如果没有查至U,那么这个单词应是一个用户自定义的标识符(可能是变量名、常量名或是过程的名字),把Sym置为ident,把这个单词存入id变量。查保存字表时使用了二分法查找以提高效率。如果getch获得的字符是数字,那么继续用getch获取数字,并把它们拼成一个整数,然后把SyIn置为number,并把拼成的数值放入num变量。如果识别出其它合法的符号仕匕方:赋值号、大于号、小于等于号等),那么把Sym那么成相应的类型。如果遇到不合法的字符,把Sym置成nul。语法分析子程序分析:语法分析子程序采用了自顶向下的递归子程序法,语法分析同时也根据程序的语意生成相应的代码,并提供了出错处理的机制。语法分析主要山分程序分析过程(block)常量定义分析过程(COnStdeClaratiOn)变量定义分析过程(vardeclaration)语句分析过程(Statelnent)表达式处理过程(expression)项处理过程(term)因子处理过程(factor)和条件处理过程(COnditiOn)构成。这些过程在结构上构成一个嵌套的层次结构。除此之外,还有出错报告过程(error)、代码生成过程(gen)测试单词合法性及出错恢复过程(test)、登录名字表过程(enter)查询名字表函数(POSitiOn)以及列出类PCODE代码过程(IiStCOde)作过语法分析的辅助过程。由PL/O的语法图可知:一个完整的PL/O程序是由分程序和句号构成的。因此,本编译程序在运行的时候,通过主程序中调用分程序处理过程block来分析分程序局部(分程序分析过程中还可能会递归调用block过程),然后,判断最后读入的符号是否为句号。如果是句号且分程序分析中未出错,那么是一个合法的PL/O程序,可以运行生成的代码,否那么就说明源PL/O程序是不合法的,输出出错提示即可。下面按各语法单元分析PL/O编译程序的运行机制。分程序处理过程:语法分析开始后,首先调用分程序处理过程(block)处理分程序。过程入口参数置为:0层、符号表位置0、出错恢复单词集合为句号、声明符或语句开始符。进入block过程后,首先把局部数据段分配指针设为3,准备分配3个单元供运行期存放静态链SL、动态链DL和返回地址RA。然后用IxO记录下当前符号表位置并产生一条jmp指令,准备跳转到主程序的开始位置,由于当前还没有知到主程序究竟在何处开始,所以jmp的Ll标暂时填为0,稍后再改。同时在符号表的当前位置记录下这个jmp指令在代码段中的位置。在判断了嵌套层数没有超过规定的层数后,开始分析源程序。首先判断是否遇到了常量声明,如果遇到那么开始常量定义,把常量存入符号表。接下去用同样的方法分析变量声明,变量定义过程中会用dx变量记录下局部数据段分配的空间个数。然后如果遇到PrOCedUre保存字那么进行过程声明和定义,声明的方法是把过程的名字和所在的层次记入符号表,过程定义的方法就是通过递归调用block过程,因为每个过程都是一个分程序。由于这是分程序中的分程序,因此调用block时需把当前的层次号IeV加一传递给block过程。分程序声明局部完成后,即将进入语句的处理,这时的代码分配指针ex的值正好指向语句的开始位置,这个位置正是前面的jmp指令需要跳转到的位置。于是通过前面记录下来的地址值,把这个j叩指令的跳转位置改成当前ex的位置。并在符号表中记录下当前的代码段分配地址和局部数据段要分配的大小Sx的值)。生成一条int指令,分配dx个空间,作为这个分程序段的笫一条指令。下面就调用语句处理过程Statenlent分析语句。分析完成后,生成操作数为。的。Pr指令,用于从分程序返回(对于0层的主程序来说,就是程序运行完成,退出)。常量定义过程:通过循环,反复获得标识符和对应的值,存入符号表。符号表中记录下标识符的名字和它对应的值。变量定义过程:与常量定义类似,通过循环,反复获得标识符,存入符号表。符号表中记录下标识符的名字、它所在的层及它在所在层中的偏移地址。语句处理过程:语句处理过程是一个嵌套子程序,通过调用表达式处理、项处理、因子处理等过程及递归调用自己来实现对语句的分析。语句处理过程可以识别的语句包括赋值语句、read语句、Write语句、Call语句、It语句、WhiIe语句。当遇到begin/end语句时,就递归调用自己来分析。分析的同时生成相应的类PCODE指令。赋值语句的处理:首先获取赋值号左边的标识符,从符号表中找到它的信息,并确认这个标识符确为变量名。然后通过调用表达式处理过程算得赋值号右部的表达式的值并生成相应的指令保证这个值放在运行期的数据栈顶。最后通过前面查到的左部变量的位置信息,生成相应的st。指令,把栈顶值存入指定的变量的空间,实现了赋值操作。read语句的处理:确定read语句语法合理的前提下(否那么报错),生成相应的指令:第一条是16号操作的。Pr指令,实现从标准输入设备上读一个整数值,放在数据栈顶。第二条是Sto指令,把栈顶的值存入read语句括号中的变量所在的单元。write语句的处理:与read语句相似。在语法正确的前提下,生成指令:通过循环调用表达式处理过程分析Write语句括号中的每一个表达式,生成相应指令保证把表达式的值算出并放到数据栈顶并生成14号操作的OPr指令,输出表达式的值。最后生成15号操作的。Pr指令输出一个换行。call语句的处理:从符号表中找到CaII语句右部的标识符,获得其所在层次和偏移地址。然后生成相应的cal指令。至于调用子过程所需的保护现场等工作是Ill类PCODE解释程疗;在解释执行cal指令时自动完成的。it语句的处理:按if语句的语法,首先调用逻辑表达式处理过程处理i±语句的条件,把相应的真假值放到数据栈顶。接下去记录下代码段分配位置(即下面生成的jpc指令的位置),然后生成条件转移jpc指令(遇O或遇假转移),转移地址未知暂时填Oo然后调用语句处理过程处理then语句后面的语句或语句块。then后的语句处理完后,当前代码段分配指针的位置就应该是上面的jpc指令的转移位置。通过前面记录下的jpc指令的位置,把它的跳转位置改成当前的代码段指针位置。begin/end语句的处理:通过循环遍历begin/end语句块中的每一个语句,通过递归调用语句分析过程分析并生成相应代码。Wh订e语句的处理:首先用CXI变量记下当前代码段分配位置,作为循环的开始位置。然后处理While语句中的条件表达式生成相应代码把结果放在数据栈顶,再用cx2变量记下当前位置,生成条件转移指令,转移位置未知,填0。通过递归调用语句分析过程分析do语句后的语句或语句块并生成相应代码。最后生成一条无条件跳转指令jmp,跳转到Cxl所指位置,并把cx2所指的条件跳转指令的跳转位置改成当前代码段分配位置。表达式、项、因子处理:根据PL/O语法可知,表达式应该是山正负号或无符号开头、由假设干个项以加减号连接而成。而项是山假设干个因子以乘除号连接而成,因子那么可能是一个标识符或一个数字,或是一个以括号括起来的子表达式。根据这样的结构,构造出相应的过程,递归调用就完成了表达式的处理。把项和因子独立开处理解决了加减号与乘除号的优先级问题。在这儿个过程的反复调用中,始终传递fsys变量的值,保证可以在出错的情况下跳过出错的符号,使分析过程得以进行下去。逻辑表达式的处理:首先判断是否为一元逻辑表达式:判奇偶。如果是,那么通过调用表达式处理过程分析计算表达式的值,然后生成判奇指令。如果不是,那么肯定是二元逻辑运算符,通过调用表达式处理过程依次分析运算符左右两局部的值,放在栈顶的两个空间中,然后依不同的逻辑运算符,生成相应的逻辑判断指令,放入代码段。判断单词合法性与出错恢复过程分析:本过程有三个参数,si、s2为两个符号集合,n为出错代码。本过程的功能是:测试当前符号(即Sym变量中的值)是否在Si集合中,如果不在,就通过调用出错报告过程输出出错代码n,并放弃当前符号,通过词法分析过程获取一下单词,直到这个单词出现在Si或s2集合中为止。这个过程在实际使用中很灵活,主要有两个用法:在进入某个语法单位时,调用本过程,检查当前符号是否属于该语法单位的开始符号集合。假设不属于,那么滤去开始符号和后继符号集合外的所有符号。在语法单位分析结束时,调用本过程,检查当前符号是否属于调用该语法单位时应有的后继符号集合。假设不属于,那么滤去后继符号和开始符号集合外的所有符号。通过这样的机制,可以在源程序出现错误时,及时跳过出错的局部,保证语法分析可以继续下去。语法分析过程中调用的其它子过程相比照拟简单,请参考源程序的注释。类PCODE代码解释执行过程分析这个过程模拟了一台可以运行类PCODE指令的栈式计算机。它拥有一个栈式数据段用于存放运行期数据、拥有一个代码段用于存放类PeODE程序代码。同时还拥用数据段分配指针、指令指针、指令存放器、局部段基址指针等存放器。解释执行类PCODE代码时,数据段存储分配方式如下:对于源程序的每一个过程(包括主程序),在被调用时,首先在数据段中开辟三个空间,存放静态链SL、动态链DL和返回地址RA。静态链记录了定义该过程的直接外过程(或主程序)运行时最新数据段的基地址。动态链记录调用该过程前正在运行的过程的数据段基址。返回地址记录了调用该过程时程序运行的断点位置。对于主程序来说,SL、DL和RA的值均置为0。静态链的功能是在一个子过程要引用它的直接或间接父过程(这里的父过程是按定义过程时的嵌套悄况来定的,而不是按执行时的调用顺序定的)的变量时,可以通过静态链,跳过个数为层差的数据段,找到包含要引用的变量所在的数据段基址,然后通过偏移地址访问它。在过程返回时,解释程序通过返回地址恢复指令指针的值到调用前的地址,通过当前段基址恢复数据段分配指针,通过动态链恢复局部段基址指针。实现子过程的返回。对于主程序来说,解释程序会遇到返回地址为0的请况,这时就认为程序运行结束。解释程序过程中的base函数的功能,就是用于沿着静态链,向前查找相差指定层数的局部数据段基址。这在使用st。、Iod等访问局部变量的指令中会经常用到。类PCODE代码解释执行的局部通过循环和简单的case判断不同的指令,做出相应的动作。当遇到主程序中的返回指令时,指令指针会指到0位置,把这样一个条件作为终至循环的条件,保证程序运行可以正常的结束。programpl(input,output);(*PL/O编译程序与代码生成解释运行程序*)(*PL/OcompiIerwithcodegeneration*)label99;(*声明出错跳转标记*)ConSt(*常量定义*)norw二11;(*ofreservedwords*)(*保存字的个数*)txmax=100;(*lengthofidentifiertable*)(*标识符表的长度(容ft)*)nmax=14;(水maxnumberofdigitsinnumbers*)(*数字允许的最长位数*)al=10;(*lengthofidentifiers*)(*标识符最长长度*)amax=2047;(*maximumaddress*)(水寻址空间水)levmax=3;(*maxdepthofblocknesting*)(*最大允许的块嵌套层数*)cxmax二200;(*sizeofcodearray*)(*类PCODE目标代码数组长度(可容纳代码行数)*)type&类型定义粉symbol=(nul,ident,number,plus,minus,times,slash,oddsym,eql,neq,155, leq,gtr,geq,Iparen,rparen,comma,semicolon,period,becomes,beginsym,endsym,ifsym,thensym,whilesym,writesym,readsym,dosym,callsym,constsym,varsym,procsym);(*symobl类型标识了不同类型的词汇*)alfa=packedarray1.alofchar;(*alfa类型用于标识符*)objectl=(constant,variable,procedur);(*objectl为三种标识符的类型*)symset二setofsymbol:(*symset是symbol类型的一个集合类型,可用于存放一组symbol*)fct=(lit,opr,lod,sto,cal,int,jmp,jpc);(*fct类型分别标识类PCODE的各条指令*)instruction=packedrecordf:fct;(/Kfunctioncode*)1: 0levmax;(*level*)a:0.amax;(*displacementaddr*)end;&类PeODE指令类型,包含三个字段:指令f、层差1和另一个操作数a*)lit0,aloadconstantaopr0,aexecuteopraIod1,aloadvariable1,asto1,astorevariable1,acal1,acallprocedureaatlevel1int0,aincrementt-registerbyajmp0,ajumptoajpc0,ajumpconditionaltoa*)var(*全局变量定义*)ch:char;(*lastcharread*)(*主要用于词法分析器,存放最近一次从文件中读出的字符*)sym:symbol;(*lastsymbolread*)(*词法分析器输出结果之用,存放最近一次识别出来的token的类型*)id:alfa;(*lastidentJ±ierread*)(*词法分析器输出结果之用,存放最近一次识别出来的标识符的名字*)num:integer;(*lastnumberread*)(*词法分析器输出结果之用,存放最近一次识别出来的数字的值*)cc:integer;(*charactercount*)(*行缓冲区指针*)11:integer;(*linelength*)(*行缓冲区长度*)kk:integer;(*引入此变量是出于程序性能考虑,见getsym过程注释*)ex:integer;(*codeallocationindex*)(*代码分配指针,代码生成模块总在ex所指位置生成新的代码*)line:array1.81ofchar;(*行缓冲区,用于从文件读出一行,供词法分析获取单词时之用*)a:alfa;&词法分析器中用于临时存放正在分析的词*)code:array0.cxmaxofinstruction;(*生成的类PCODE代码表,存放编译得到的类PCoDE代码*)word:array1.norwofalfa;(*保存字表*)wsym:array1.norwofsymbol;(*保存字表中每一个保存字对应的symbol类型*)ssym:arrayofsymbol:(*一些符号对应的symbol类型表*)(*wirthusesarraycharhere*)mnemonic:arrayfctofpackedarray1.5ofchar;(*类PCODE旨令助记符表*)declbegsys,Statbegsys,facbegsys:symset:(声明开始、表达式开始和项开始符号集合*)table:array0.txmaxZofrecord(*符号表*)name:alfa;(*符号的名字*)casekind:objectlof(*符号的类型*)constant:(*如果是常量名*)(val:integer):(*val中放常量的值*)variable,procedur:(*如果是变量名或过程名*)(level,adr,size:integer)1*存放层差、偏移地址和大小*)(*“size"lackinginorginal.Ithinkitbelonshere*)end;fin,fout:text;(*fin文本文件用于指向输入的源程序文件,fout程序中没有用到*)sfile:string;(*存放PL/0源程序文件的文件名*)(*出错处理过程error*)(*参数:n:出错代码*)procedureerror(n:integer);beginwritein('*','':ccT,n:2);(*在屏幕CCT位置显不!与出错代码提示,由于CC是行缓冲区指针,所以!所指位置即为出错位置*)writein(fal,与出错代码提示*):cc1,n:2);(*在文件CCT位置输出!err:Zlerr+1(*出错总次数加一*)end(*error*);(*词法分析过程gctsym*)proceduregetsym;varI ,j,k:integer;(*读取原程序中下一个字符过程getch*)proceduregetch;beginifCC二11then(*如果行缓冲区指针指向行缓冲区最后一个字符就从文件读一行到行缓冲区*)beginifeof(fin)then(*如果到达文件末尾*)beginwriteProgramincomplete,);(*出错,退出程序水)close(fin);end;II :=O;1*行缓冲区长度置O*)cc:=O;(*行缓冲区指针置行首*)write(ex:4,'');&输出ex值,宽度为4*)write(fal,ex:4,'');(*输出ex值,宽度为4到文件*)whilenoteoln(fin)do(*当未到行末时*)beginH:=H+1;1*行缓冲区长度加一*)read(fin,ch);(*从文件读入一个字符到Ch*)write(Ch);1*在屏幕输出Ch*)write(fdl,ch);(*把小输出到文件*)IineElU:=ch;(*把读到的字符存入行缓冲区相应的位置*)end;(*可见,PL/O源程序要求每行的长度都小于81个字符*)writein;III :=H÷1;(*行缓冲区长度加一,用于容纳即将读入的回车符CR*)read(fin,linell);(*把#13(CR)读入行缓冲区尾部*)read(fin,ch):(*我添加的代码。由于PC上文本文件换行是以#13#Io(CR+LF)表示的,所以要把多余的LF从文件读出,这里放在ch变量中是由于ch变量的值在下面即将被改变,把这个多余值放在Ch中没有问题*)writein(fal);end;CC:二CC+1;(*行缓冲区指针加一,指向即将读到的字符*)Ch:二IineECc(*读出字符,放入全局变量ch*)end(*getch*);begin(*getsym*)while(ch二'')dogetch;ifchin,d,.,z,then(*如果读出的字符是一个字母,说明是保存字或标识符*)begink:=0;(廉标识符缓冲区指针置0*)repeat(*这个循环用于依次读出源文件中的字符构成标识符粉Itk<althen(*如果标识符长度没有超过最大标识符长度(如果超过,就取前面一局部,把多余的抛弃)*)begink:二k+1;ak:二ch;end;getch(*读下一个字符*)untilnot(Chin'a'.'z','0'.9');(*直到读出的不是字母或数字,山此可知PL/O的标识符构成规那么是:以字母开头,后面跟假设干个字母或数字*)ifk>=kkthen(*如果当前获得的标识符长度大于等于kk*)kk:=k(*令kk为当前标识符长度*)elserepeat(*这个循环用于把标识符缓冲后部没有填入相应字母或空格的空间用空格补足*)akk:二',;kk:=kk-1untilkk=k;1*在第一次运行这个过程时,kk的值为al,即最大标识符长度,如果读到的标识符长度小于kk,就把a数组的后部没有字母的空间用空格补足。这时,kk的值就成为a数组前部非空格字符的个数。以后再运行getsym时,如果读到的标识符长度大于等于kk,就把kk的值变成、T前标识符的长度。这时就不必在后面填空格了,因为它的后面肯定全是空格。反之如果最近读到的标识符长度小于kk,那就需要从kk位置向前,把超过当前标识长度的空间填满空格。以上的这样一个逻辑,完全是出于程序性能的上考虑。其实完全可以简单的把a数组中ak元素以后的空间不管三七二十一全填空格。*)(*下面开始二分法查找看读出的标识符是不是保存字之一*)id:二a;(*最后读出标识符等于a*)i:=1;1*i指向第一个保存字*)j:二norw;1*j指向最后一个保存字*)repeatk:二(i+j)div2;(*k指向中间一个保存字*)ifid<=worclkthen(*如果当前的标识符小于k所指的保存字*)j:=k-1;(*移动j指针*)ifid>=wordkthen(*如果当前的标识符大于k所指的保存字*)i:二k+1(*移动i指针*)untili>j;(*循环直到找完保存字表时ifi-1>Jthen(*如果i-1>j说明在保存字表中找到相应的项,id中存的是保存字*)sym:=vsymk&找到保存字,把SyIn置为相应的保存字值*)elsesym:Zlident(*未找到保存字,把Sym置为ident类型,表示是标识符*)end(*至此读出字符为字母即对保存字或标识符的处理结束*)else(*如果读出字符不是字母*)ifchin,0,.,9,then1*如果读出字符是数字*)begin(*number*)(*开始对数字进行处理*)k:二0;(*数字位数*)num:二0;(*数字置为0*)sym:=number:1*置Syln为number,表示这一次读到的是数字*)repeat(*这个循环依次从源文件中读出字符,组成数字粉num:=10*num+(ord(ch)-ord('0');(*num*10加上最近读出的字符ASCII减'0,的ASCIl得到相应的数值*)k:二k+1;(*数字位数加一*)getchuntilnot(chin,0,.,9,);(*直到读出的字符不是数字为止*)i±k>nmaxthen(*如果组成的数字位数大于最大允许的数字位数*)error(30)(*发出30号错*)end(*至此对数字的识别处理结束时elsei±ch二':then(*如果读出的不字母也不是数字而是冒号时begingetch;(*再读一个字符*)i±ch二'二'then1*如果读到的是等号,正好可以与冒号构成赋值号*)beginsym:二becomes;(*sym的类型设为赋值号becomes*)getch(*再读出下一个字*)endelsesy:=nul;(*如果不是读到等号,那单独的一个冒号就什么也不是*)end仕以上完成对赋值号的处理*)else(*如果读到不是字母也不是数字也不是冒号粉ifch=*<*then(*如果读到小于号*)begingetch;(*再读一个字符*)ifch=*二'then(*如果读到等号*)beginsym:=Ieq;(*购成一个小于等于号*)getch(*读一个字符*)endelse(*如果小于号后不是跟的等号*)sym:=Iss1*那就是一个单独的小于号*)endelse(*如果读到不是字母也不是数字也不是冒号也不是小于号*)Iich二',then(*如果读到大于号,处理过程类似于处理小于号*)getch;(*再读一个字符欢)ifch二'二'then(*如果读到等号*)beginsym:二geq;(*购成一个大于等于号*)getch(*读一个字符*)endelse(*如果大于号后不是跟的等号*)sym:=gtr1*那就是一个单独的大于号*)endelse(*如果读到不是字母也不是数字也不是冒号也不是小于号也不是大于号*)begin(*那就说明它不是标识符/保存字,也不是复杂的双字节操作符,应该是一个普通的符号*)sym:=ssymch:(*直接成符号表中查到它的类型,赋给Sym*)getch(*读下一个字符*)end(*整个it语句判断结束*)end(*getsym*);(*词法分析过程getsym总结:从源文件中读出假设干有效字符,组成一个token串,识别它的类型为保存字/标识符/数字或是其它符号。如果是保存字,把Synl置成相应的保存字类型,如果是标识符,把Syln置成ident表示是标识符,于此同时,id变量中存放的即为保留字字符串或标识符名字。如果是数字,把Synl置为number,同时num变量中存放该数字的值。如果是其它的操作符,那么直接把sym置成相应类型。经过本过程后ch变量中存放的是下一个即将被识别的字符*)(*目标代码生成过程gen*)(*参数:x:要生成的一行代码的助记符*)(*y,z:代码的两个操作数*)(*本过程用于把生成的U标代码写入U标代码数组,供后面的解释器解释执行*)proceduregen(x:fct;y,z:integer);beginifex>exmaxthen(*如果cx>cxmax表示半前生成的代码行号大于允许的最大代码行数*)writeprogramtoolong,);goto99(*输出程序太长,退出水)end;withcodeexdobeginf:二x;1:二y;a:=zend;ex:Zlex+1endgen);1*测试当前单词是否合法过程test*)(*参数:si:当语法分析进入或退出某一语法单元时当前单词符合应属于的集合*)(*s2:在某一出错状态下,可恢复语法分析正常工作的补充单词集合*)(*n:出错信息编号,当当前符号不属于合法的Si集合时发出的出错信息时proceduretest(si,s2:symset:n:integer):beginifnot(syminSi)then(*如果当前符号不在si中*)beginerror(n);(*发出n号错误水)si:二si+s2;(*把s2集合补充进Si集合*)whilenot(syminsi)do(*通过循环找到下一个合法的符号,以恢复语法分析工作*)getsymendend(*test*);(*语法分析过程block*)(*参数:lev:这一次语法分析所在的层次*)(*tx:符号表指针*)(*fsys:用于出错恢复的单词集合*)procedureblock(lev,tx:integer;fsys:symset);vardx:integer;(*dataallocationindex*)(*数据段内存分配指针,指向下一个被分配空间在数据段中的偏移位置*)txO:integer;(*initialtableindex*)(*记录本层开始时符号表位置*)exO:integer;(*initialcodeindex*)(*记录本层开始时代码段分配位置时(*登陆符号表过程enter)&参数:k:欲登陆到符号表的符号类型水)procedureenter(k:objectl);begin(*enterobjectintotable*)tx:=tx÷1;(*符号表指针指向一个新的空位豺withtabletxdo(*开始登录*)beginname:=id;(*name是符号的名字,对于标识符,这里就是标识符的名字时kind:二k;(*符号类型,可能是常量、变量或过程名*)casekof(*根据不同的类型进行不同的操作*)constant:(*如果是常量名*)beginitnum>amaxthen(*在常量的数值大于允许的最大值的惜况下*)beginerror(31);(*抛出31号错误时num:=0;(*实际登陆的数字以。代替*)end;val:二num(*如是合法的数值,就登陆到符号表*)end;variable:(*如果是变量名*)beginlevel:Zllev;(*记下它所属的层次号*)adr:二dx;(*记下它在当前层中的偏移量*)dx:=dx+1;(*偏移量自增一,为下一次做好准备*)end;procedur:(*如果要登陆的是过程名*)level:二IeV(*记录下这个过程所在层次*endendend(*enter*);(*登录符号过程没有考虑到重复的定义的问题。如果出现重复定义,那么以最后一次的定义为准。*)(*在符号表中查找指定符号所在位置的函数PoSition*)(*参数:id:要找的符号粉(*返回值:要找的符号在符号表中的位置,如果找不到就返回0*)functionposition(id:alfa):integer;vari:integer;begin(*findidentifierintable*)table01.name:=id;(*先把id放入符号表0号位置*)i:二tx;(*从符号表中当前位置也即最后一个符号开始找*)whiletablei.nameOiddo(*如果当前的符号与要找的不一致*)i:=i-1;(*找前面一个*)position:=i(*返回找到的位置号,如果没找到那么一定正好为0*)end1*position*);(*常量声明处理过程COnStdeClaratiOn*)procedureconstdeclaration;beginifsym2identthen(*常量声明过程开始遇到的第一个符号必然应为标识符*)begingetsym;(水获取下一个token*)itsymineql,becomesthen(*如果是等号或赋值号水)beginitsym=becomesthen(*如果是赋值号(常量生明中应该是等号)*)error(1);(*抛出1号错误*)1*这里其实自动进行了错误纠正使编译继续进行,把赋值号当作等号处理*)getsym;(*获取下一个token,等号或赋值号后应接上数字*itsym二numberthen(*如果确实是数字*)beginenter(constant);(*把这个常量登陆到符号表*)getsym(*获取下一个token,为后面作准备*)endelseerror(2)(*如果等号后接的不是数字,抛出2号错误时endelseerror(3)仕如果常量标识符后接的不是等号或赋值号,抛出3号错误水)endelseerror(4)(*如果常量声明过程遇到的第一个符号不为标识符,抛出4号错误*)end(*constdeclaration*);(*变量声明过程VardeCIaration*)procedureVardeclaration;beginifsymZlidentthen(*变量声明过程开始遇到的第一个符号必然应为标识符*)beginenter(variable);(*将标识符登陆到符号表中*)getsym(*获取下一个token,为后而作准备*)endelseerror(4)(*如果变量声明过程遇到的第一个符号不是标识符,抛出4号错误*)end(*Vardeclaration水);3列出当前一层类PCODE目标代码过程listcode*)procedurelistcode;vari:integer;begin(*listcodegeneratedforthisblock*)iflistswitchthen(*如果用户选择是要列出代码的情况下才列出代码*)beginforiexOtoex-1do(*从当前层代码开始位置到当前代码位置T处,即为本分程序块*)withcodeidobeginwritein(i:4,mnemonicf:5,1:3,a:5);(*显示出第i行代码的助记符和L与A操作数*)(*我修改的代码:原程序此处在输出i时,没有指定占4个字符宽度,不美观也与下面一句不配套。*)writein(fa,i:4,mnemonicf:5,1:3,a:5(*同时把屏显打印到文件*)end;endend(*listcode*);(*语句处理过程statement*)(*参数说明:fsys:如果出错可用来恢复语法分析的符号集合粉procedurestatement(fsys:symset);i,cxl,cx2:integer;1*表达式处理过程expression*)(*参数说明:fsys:如果出错可用来恢复语法分析的符号集合*)procedureexpression(fsys:symset);varaddop:symbol;(*项处理过程term*)(*参数说明:fsys:如果出错可用来恢复语法分析的符号集合水)procedureterm(fsys:symset);varmulop:symbol;(*因子处理过程factor*)(*参数说明:fsy

    注意事项

    本文(pl0语法分析词法分析语义分析.docx)为本站会员(夺命阿水)主动上传,课桌文档仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知课桌文档(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-1

    经营许可证:宁B2-20210002

    宁公网安备 64010402000986号

    课桌文档
    收起
    展开