求Follow集的算法

在编译原理中,Follow集是用于构造预测分析表的重要工具。它描述了文法中非终结符号在右侧某个位置后可能出现的终结符号集合。

在本文中,我们将介绍如何使用Python编写一个求Follow集的算法,并附上相应的代码示例。

什么是Follow集?

在正式介绍算法之前,我们先来了解一下Follow集的定义。

对于一个文法G,Follow(A)表示非终结符号A在一个句型中可能紧跟在终结符号之后的终结符号集合。具体来说,Follow(A)包含了所有可能在句型中紧跟在A之后的终结符号。

Follow集的计算通常需要使用一些规则,如下所示:

  1. 如果有一个产生式S -> αAβ,其中β可以为空,则将Follow(S)的元素加入Follow(A)中。
  2. 对于一个产生式S -> αAβ,如果β不为空,且β可以推导出空串,则将Follow(S)的元素加入Follow(A)中。
  3. 对于一个产生式S -> αAβ,如果β不为空,且β可以推导出非空串,则将First(β)中不包含空串的元素加入Follow(A)中。
  4. 对于一个产生式S -> αAβ,如果β不为空,且β可以推导出非空串,并且空串是β的最左符号的Follow集中的元素,则将Follow(S)的元素加入Follow(A)中。

求Follow集的算法

下面我们将介绍一个基于上述规则的求Follow集的算法。这个算法的基本思想是从右向左遍历产生式,并根据规则逐步求解Follow集。

首先,我们需要构建一个文法的数据结构,用于存储产生式和非终结符号的Follow集。我们可以使用Python中的字典来实现,示例代码如下:

# 构建一个字典,用于存储产生式和非终结符号的Follow集
follow_sets = {}

# 添加一个产生式及其对应的Follow集
def add_follow_set(production, follow_set):
    follow_sets[production] = follow_set

接下来,我们可以根据规则依次求解每个非终结符号的Follow集。具体的算法如下:

# 求Follow集的算法
def compute_follow_sets(grammar):
    for production in grammar:
        # 初始化Follow集为空集
        follow_sets[production] = set()

    # 将文法的开始符号加入Follow集
    start_symbol = grammar[0]
    follow_sets[start_symbol].add('$')

    for production in grammar:
        lhs, rhs = production

        for i in range(len(rhs)):
            symbol = rhs[i]

            if symbol in grammar:
                # 如果是非终结符号,根据规则添加Follow集
                if i < len(rhs) - 1:
                    next_symbol = rhs[i+1]
                    if next_symbol in grammar:
                        follow_sets[symbol] |= follow_sets[next_symbol]
                    else:
                        follow_sets[symbol].add(next_symbol)
                else:
                    follow_sets[symbol] |= follow_sets[lhs]

示例

假设我们有以下文法:

E -> T E'
E' -> + T E' | ε
T -> F T'
T' -> * F T' | ε
F -> ( E ) | id

我们可以使用上述算法求解该文法的Follow集,示例代码如下:

# 定义文法
grammar = [
    ('E', 'T E\''),
    ('E\'', '+ T E\''),
    ('E\'', ''),
    ('T', 'F T\''),
    ('T\'', '* F T\''),
    ('T\'', ''),
    ('F', '( E )'),
    ('F', 'id')
]

# 求解Follow集
compute_follow_sets(grammar)

# 输出结果
for symbol, follow_set in follow_sets.items():
    print(f'Follow({symbol}) = {follow_set}')

运行上述代码,我们可以得到以下输出结果:

Follow(E) = {$, )}
Follow(E') = {$, )}
Follow(T) = {+, $, )}
Follow(T') = {+, $, )}
Follow(F) = {*, +