词法分析器实验报告一、实验目的及要求本次实验通过用C语言 设计、编制、调试一个词法分析子程序, 识别单词,实现一个c语言词法分析器,经过此过程可以加深对编译 器解析单词流的过程的了解运行环境:硬件:windows xp软件:visual C++6.0二、实验步骤1. 查询资料,了解词法分析器的工作过程与原理2. 分析题目,整理出基本设计思路3. 实践编码,将设计思想转换用c语言编码实现,编译运行4. 测试功能,多次设置包含不同字符,关键字的待解析文件,仔细察 看运行结果,检测该分析器的分析结果是否正确通过最终的测试发 现问题,逐渐完善代码中设置的分析对象与关键字表,拓宽分析范围 提高分析能力三、实验内容本实验中将c语言单词符号分成了四类:关键字key (特别的将 main说明为主函数)、普通标示符、常数和界符将关键字初始化在 一个字符型指针数组*key[]中,将界符分别由程序中的case列出 在词法分析过程中,关键字表和case列出的界符的内容是固定不变 的(由程序中的初始化确定),因此,从源文件字符串中识别出现的 关键字,界符只能从其中选取标识符、常数是在分析过程中不断形 成的对于一个具体源程序而言,在扫描字符串时识别出一个单词,若 这个单词的类型是关键字、普通标示符、常数或界符中之一,那么就 将此单词以文字说明的形式输出.每次调用词法分析程序,它均能自 动继续扫描下去,形成下一个单词,直到整个源程序全部扫描完毕, 从而形成相应的单词串。
输出形式例如:void $关键字流程图 、程序流程图:开始否'是是空格否是B是是输入源文 件路径输出word 为界符输 出word 为常数路径是否 效否* 是字母吗一否是数字吗打开源文件初始化文件指针识别指针内容将字符加入字符数组Word[]将字符加入字符数―1组Word[]跳过该字符指向下一字符指向下一字符指向下一字符识别指针内容回退指向下一字符■*输 出Word 内容为不 可识别,‘输 出word / 为关键字是字母惑数字 否 将word与关键 字表key进行匹结束将字符加 入字符数 组Word[]普通标示符 —否—匹配?将字符 加入字 符数组 Word[]将字符 加入字 符数组 Word[]程序:#include#include #include#include//定义关键字char"return"};,-rr r -I rx~\ 「〃 ・〃〃 ・1〃〃・ 』〃〃i 〃〃 ・ 』r»〃〃 r»〃〃i 〃〃・r»〃*Key[10]={"main","void","int","char","printf","scanf","else","if" char Word[20],ch; //存储识别出的单词流int IsAlpha(char c) { //判断是否为字母 if(((c<='z')&&(c>='a'))||((c<='Z')&&(c>='A'))) return 1; else return 0;}int IsNum(char c){ //判断是否为数字 if(c>='0'&&c<='9') return 1;else return 0;}int IsKey(char *Word){ //识别关键字函数 int m,i;for(i=0;i<9;i++){ if((m=strcmp(Word,Key[i]))==0) {if(i==0) return 2;return 1;}}return 0;}void scanner(FILE *fp){ //扫描函数char Word[20]={'\0'};char ch;int i,c;ch=fgetc(fp); //获取字符,指针fp并自动指向下一个字符if(IsAlpha(ch)){ //判断该字符是否是字母Word[0]=ch;ch=fgetc(fp);i=1;while(IsNum(ch)||IsAlpha(ch)){ //判断该字符是否是字母或数字 Word[i]=ch;i++;ch=fgetc(fp);}Word[i]='\0'; fseek(fp,-1,1); c=IsKey(Word);//'\0'代表字符结束(空格)//回退一个字符//判断是否是关键字if(c==O) prin tf("%s\t$普通标识符\n\n",Word);//不是关键字 else 辻(c==2) prin tf("%s\t$主函数\n\n",Word);else prin tf("%s\t$关键字\n\n",Word); //输出关键字}else //开始判断的字符不是字母if(IsNum(ch)){ //判断是否是数字Word[0]=ch;ch=fgetc(fp);i=1;while(IsNum(ch)){Word[i]=ch;i++; ch=fgetc(fp);}Word[i]='\0';fseek(fp,-1,1); //回退prin tf("%s\t$无符号实数\n\n",Word);}else //开始判断的字符不是字母也不是数字{Word[0]=ch;switch(ch){case'[':case']':case'(':case')':5 f 5case'{':5 1 5case'}':case',':case'"':case';':pri ntf ("%s\t$界符\n\n",Word); break; case'+':ch=fgetc(fp);Word[1]=ch;if(ch=='='){prin tf("%s\t$运算符\n\n",Word);//运算符“ +二”}else if(ch=='+'){prin tf("%s\t$运算符\n\n",Word); //判断结果为“ ++”}else {fseek(fp,-1,1);prin tf("%s\t$运算符\n\n",Word); //判断结果为 “+”} break;case'-':ch=fgetc(fp);Word[1]=ch;if(ch=='='){prin tf("%s\t$运算符\n\n",Word); }else if(ch=='-'){prin tf("%s\t$运算符\n\n",Word); //判断结果为“一” }else {fseek(fp,-1,1);prin tf("%s\t$运算符\n\n",Word); //判断结果为“-” }break;case'*':case'/':'I 'case'!': case'=':ch=fgetc(fp);if(ch=='='){prin tf("%s\t$运算符\n\n",Word);}else {fseek(fp,-1,1);prin tf("%s\t$运算符\n\n",Word);} break;case'<':ch=fgetc(fp);Word[1]=ch;if(ch=='='){<=”printf("%s\t$运算符\n\n",Word); //判断结果为运算符}else if(ch=='<'){prin tf("%s\t$运算符\n\n",Word); //判断结果为“〈〈” }else {fseek(fp,-1,1);prin tf("%s\t$运算符\n\n",Word); //判断结果为“〈” }break; case'>':ch=fgetc(fp);Word[1]=ch;if(ch=='=') prin tf (〃%s\t$运算符\n\n",Word); else {fseek(fp,-1,1);prin tf("%s\t$运算符\n\n",Word);} break;case'%':ch=fgetc(fp);Word[1]=ch;辻(ch=='二'){prin tf("%s\t$运算符\n\n",Word);}辻(IsAlpha(ch)) prin tf("%s\t$类型标识符\n\n",Word); else {fseek(fp,-1,1);prin tf("%s\t$取余运算符\n\n",Word);}break;defaul t:prin tf("无法识别字符!\n\n"); break;}}}main(){char in_fn[30]; //文件路径FILE *fp;printf (〃\n请输入源文件名(包括路径和后缀名):〃); while(1){gets(in_fn); //scanf("%s",in_fn);if((fp=fopen(in_fn,"r"))!=NULL) break; //读取文件内容,并返回文件指针,该 指针指向文件的第一个字符else prin tf("文件路径错误!请重新输入:");}printf ("\n******************* 词法分析结果如下 *******************\n");do{ch=fgetc(fp);if(ch=='#') break; //文件以#结尾,作为扫描结束条件else if(ch==' '||ch=='\t'||ch=='\n'){} //忽略空格,空白,和换行 else{//回退一个字节开始识别单词流fseek(fp,-1,1); scanner(fp);}}while(ch!='#');return(0);}4.实验结果解析源文件:void main(){int a=3;a+=b;printf("%d",a);return;}#解析结果:5. 实验总结分析通过本次实验,让再次浏览了有关C语言的一些基本知识,特别是对文件,字符串进行 基本操作的方法。
C语言中没有st ring类型,因此本实验中的对字符串提取与识别均借助 #include〈s tring.h〉及字符型数组来实现让我练习对字符串函数应用的同时也提高了自己 的逻辑思维能力在本次实验中,我纠正了一个一直以来的概念错误:main不是关键字,它定义为程序 的入口,是主函数!在本实验中,虽然我把main初始化在关键字表(字符指针类型数组)*Key[10]中,当与该数组中字符串进行比较时,若与main匹配成功, 则返回2,若为其他关键字则返回1,以此来把main从关键字中区别出来在本实验中的关键字表只初始化了几个常用的关键字,还可继续扩充(只需扩大数组, 向其中补充要添加的关键字)如果要对本程序中未识别的c语言中的一些其他的字符进行扩充(目前处理为不可识别字 符),可在程序代码中继续添加case选项,分别对相应要识别的特殊字符加以描述。