大连理工大学软件学院编译技术课程——MicroC词法分析上机实验

题目

编写词法分析编译程序

实验目的:对循环语句和条件判断语句编写词法分析编译程序,只能通过一遍扫描完成。

实验要求:
(1) 关键字:
for if then else while do until int input output
所有关键字都是小写。
(2)运算符和分隔符:
: = + - * / < > <= <> >= ; ( ) #
(2) 其他标识符(ID)和整型常数(NUM),通过以下模式定义:
ID=letter(letter | digit)*
NUM=digit digit*
(4)空格由空白、制表符和换行符组成。空格一般用来分隔ID、NUM、运算符、分隔符和关键字,词法分析阶段通常被忽略。

各种词法单元对应的词法记号如下:

词法单元 词法记号 词法单元 词法记号
for 1 : 17
if 2 := 18
then 3 < 20
else 4 <> 21
while 5 <= 22
do 6 > 23
letter(letter+digit)* 10 >= 24
digit digit* 11 = 25
+ 13 ; 26
- 14 ( 27
* 15 ) 28
/ 16 # 0
until 29 int 30
input 31 output 32

词法分析程序的功能
输入:源程序
输出:二元组(词法记号,属性值/其在符号表中的位置)构成的序列。

例如:对源程序
int x:=5; if (x>0) then x:=2*x+1/3; else x:=2/x; #
经词法分析后输出如下序列:
(30, int)(10,’x’)(18, :=) (11,5) (26, ???? (2, if ) (27,( )……

1.几点说明:
(1)关键字表的初值。
关键字作为特殊标识符处理,把它们预先安排在一张表格中(称为关键字表),当扫描程序识别出标识符,查关键字表。如能查到匹配的单词,则该单词的关键字,否则为一般标识符。关键表为一个字符串数组,其描述如下:
char *keyword[11]={”for”, ”if”, ”then” ,”else”,”while”, ”do”, “until”, “int”, “until”, “input”, “output” };

(3) 程序中需要用到的主要变量为 token , id和num.
1)id用来存放构成词法单元的字符串;
2)num用来存放整数(可以扩展到浮点数和科学计数法表示);
3)token用来存放词法单元的词法记号。

do{ 
lexical(); //将词法单元对应的记号保存到token中,属性值保存到num或者id中
switch(token) { 
case 11: printf ("(token, %d\n) ", num); break; 
case -1: printf("error!\n");break; 
default: printf("(%d,%s)\n", token, id); 
} 
}while (token!=0); 

附加题

擦,我们的密码设置才奇葩呢。
要求:
(1)必须要有字母(大小写都有)、数字、符号,八个以上字符
(2)密码每三个月重新设置一次,新设置的密码跟以前所有的密码重复的字符不超过三个

没几次搞下来就无法设自己熟悉的字符串了,只好随机创建一个,写到纸上每次抄进去。
假设旧密码为:by99YL17!
利用正规式检测输入的新密码是否符合规定。

上机要求:
上机作业需助教检查后登记才能获得上机分数。

答案

第一题

import string
result=""
def check(temp):
    global result
    if temp in dict_key:
        result=result+"("+str(dict_key[temp])+","+ str(temp)+")"+"  "
    else:
        if len(temp)==0 :
            result = result
        elif temp[0].isdigit():
            result = result + "(" + "11" + "," + temp + ")" + "  "
        else:
            result = result +"("+"10"+","+ temp+")"+"  "
dict_key = {'for': 1, 'if': 2, 'then': '3', "else": 4, "while": 5,
            "do": 6, "letter(letter+digit)*": 10, "digit digit*": 11,
            "until": 29, "input": 31, ":": 17,"int": 30, "output": 32}
dict_op ={"+": 13, "-": 14, "*": 15, "/": 16,">": 23, ">=": 24,
          "=": 25, ";": 26, "(": 27, ")": 28, "#": 0, ":=": 18, "<": 20, "<>": 21, "<=": 22}
with open("test.txt", "r", encoding='UTF-8') as f:
    data = f.read()
temp=""
print(data)
for i in data:
    if i in string.ascii_letters:
        temp=temp+i
        # 数字
    elif i.isdigit():
        temp = temp + i
        # 空格
    elif i.isspace():
        if temp!="":
            check(temp)
        temp=""
        # 字符
    else:
        check(temp)
        temp = ""
        if i in dict_op:
            result = result + "(" + str(dict_op[i]) + "," + str(i) + ")"+"  "
print(result)


第二题

# 状态
# 空:起始
# l.小写字母
# L.大写字母
# c.符号
# n.数字
# lL.小写字母+大写字母
# lc.小写字母+符号
# ln.小写字母+数字
# Lc.符号+大写字母
# cn.符号+数字
# Ln.大写字母+数字
# lLc.小写字母+大写字母+符号
# lLn 小写字母+大写字母+数字
# lcn.小写字母+符号+数字
# Lcn 大写字母+符号+数字
# lLcn 满足条件
import re
import string
origin_pwd="by99YL17!"
pwd = input("输入密码:")
print(pwd)
check_err=3
status=""
if len(pwd)<9:
    print("密码太短了!!!")
else:
    for ch in pwd:
        if(check_err<0):
            print("密码和旧密码重复位数在3以上")
            break;
        elif ch in origin_pwd:
            --check_err
        else:
            if ch.isupper():
                if "L" not in status:
                    status+="L"
            elif ch.islower():
                if "l" not in  status:
                    status+="l"
            elif ch.isdigit():
                if "n" not in  status:
                    status+="n"
            else:
                if "c" not in status:
                    status+="c"
print(status)
if "l" in status and "L" in status and "n" in status and "c" in status and check_err>=0:
    print("满足条件")
else:
    print("不满足条件")