Description

小C语言文法 
1. <程序>→<main关键字>(){<声明序列><语句序列>}
2. <声明序列>→<声明序列><声明语句>|<声明语句>|<空>
3. <声明语句>→<标识符表>;
4. <标识符表>→<标识符>,<标识符表>|<标识符>
5. <语句序列>→<语句序列><语句>|<语句>
6. <语句>→< if语句>|< while语句>|< for语句>|<复合语句>|<赋值语句>
7. < if语句>→< if关键字>(<表达式>)<复合语句>|(<表达式>)<复合语句>< else关键字><复合语句>
8. < while语句>→< while关键字>(<表达式>)<复合语句>
9. < for语句>→< for关键字>(<表达式>;<表达式>;<表达式>)<复合语句>
10. <复合语句>→{<语句序列>}
11. <赋值语句>→<表达式>;
12. <表达式>→<标识符>=<算数表达式>|<布尔表达式>
13. <布尔表达式>→<算数表达式> |<算数表达式><关系运算符><算数表达式>
14. <关系运算符>→>|<|>=|<=|==|!=
15. <算数表达式>→<算数表达式>+<项>|<算数表达式>-<项>|<项>
16. <项>→<项>*<因子>|<项>/<因子>|<因子>
17. <因子>→<标识符>|<无符号整数>|(<算数表达式>)
18. <标识符>→<字母>|<标识符><字母>|<标识符><数字>
19. <无符号整数>→<数字>|<无符号整数><数字>
20. <字母>→a|b|…|z|A|B|…|Z
21. <数字>→0|1|2|3|4|5|6|7|8|9

22. < main关键字>→main
23. < if关键字>→if
24. < else关键字>→else
25. < for关键字>→for
26. < while关键字>→while
27. < int关键字>→int

 

每行单词数不超过10个
小C语言文法如上,现在我们对小C语言写的一个源程序进行词法分析,分析出关键字、自定义标识符、整数、界符
和运算符。
关键字:main if else for while int
自定义标识符:除关键字外的标识符
整数:无符号整数
界符:{ } ( ) , ;
运算符:= + - * / < <= > >= == !=

Input

输入一个小C语言源程序,源程序长度不超过2000个字符,保证输入合法。

Output

按照源程序中单词出现顺序输出,输出二元组形式的单词串。

(单词种类,单词值)

单词一共5个种类:

关键字:用keyword表示
自定义标识符:用identifier表示
整数:用integer表示
界符:用boundary表示
运算符:用operator表示

每种单词值用该单词的符号串表示。

 
容易出错的点:大意了,自定义标识符里不是只含字母,还有数字和下划线。
一开始我以为是运算符错了,改了几次没有效果
因为题目里说保证输入合法,所以不用考虑其他字符和"i++"之类的情况
 
#include <bits/stdc++.h>

using namespace std;

char s[3000];
char bound[10] = ",;(){}";
char key[10][8] = {{"main"}, {"if"}, {"else"}, {"for"}, {"while"}, {"int"}};
char oper[10] = "+-*/<=>!";

bool checkB(char a){        //界符
    for(int i = 0; i<6; i++){
        if(a == bound[i])
            return true;
    }
    return false;
}

bool checkInt(char a){          //整数
    if(a >= '0' && a <= '9')
        return true;
    return false;
}

bool checkK(char *a){           //关键字
    for(int i = 0; i<6; i++){
        if(strcmp(a, key[i]) == 0)
            return true;
    }
    return false;
}

bool checkO(char a){            //操作数
    for(int i = 0; i<8; i++){
        if(a == oper[i])
            return true;
    }
    return false;
}

bool judgeC(char a){            //判断这个字符开头是否为字母或下划线
    if((a >= 'a' && a <= 'z') || (a >= 'A' && a <= 'Z') || a == '_')
        return true;
    return false;
}

bool judgeC2(char a){            //判断是否为标识符字符
    if((a >= 'a' && a <= 'z') || (a >= 'A' && a <= 'Z') || a == '_' || (a >= '0' && a <= '9'))
        return true;
    return false;
}

int main()
{
    while(~scanf("%s", s)){
    int n = strlen(s);
    int i = 0;
    while(i < n){
        if(s[i] == ' ' || s[i] == '\n'){
            i++;
            continue;
        }
        else if(checkB(s[i])){
            printf("(boundary,%c)\n", s[i]);
            i++;
        }
        else if(checkInt(s[i])){
            int t = i;
            while(checkInt(s[t])){
                t++;
            }
            t -= 1;
            printf("(integer,");
            for(; i <= t; i++){
                printf("%c", s[i]);
            }
            printf(")\n");
        }
        else if(judgeC(s[i])){
            int t = i;
            while(judgeC2(s[t])){
                t++;
            }
            t -= 1;
            char temp[200] = {};
            int len = t - i + 1;
            for(int j = 0; j < len; j++){
                temp[j] = s[i++];
            }
            if(checkK(temp)){
                printf("(keyword,%s)\n", temp);
            }
            else{
                printf("(identifier,%s)\n", temp);
            }
        }
       else if(checkO(s[i])){
            int t = i + 1;
            if((t != n) && (s[t] == '=')){
               printf("(operator,%c%c)\n", s[i], s[t]);
               i = t + 1;
            }
            else{
                printf("(operator,%c)\n", s[i]);
                i++;
            }
    }
    }
    }
    return 0;
}