一、试验名称
主动生成LR(0)剖析表
二、试验目标
1、实现计算闭包函数CLOSURE的算法。
2、实现转向函数GO(I,X)的算法。
3、实现ACTION子表和GOTO子表的结构算法。
4、输出任意的压缩了的上下文无关文法,输入相应的LR(0)剖析表(以表格模式输入)。
三、试验原理
1、闭包closure(I)
若文法G已拓广为G’,而S为文法G的开始符号,拓广后减少产生式S’->S。如果I是文法G’的一个我的项目集,定义和结构I的闭包closure(I)如下:
a.I的我的项目在closure(I)中。
b.若A->•B属于closure(I),则每一形如B->•的我的项目也属于closure(I)。
c.反复b直到不呈现新的我的项目为止。即closure(I)不再扩充。
2、转换函数GO(I,X)
GO(I,X)=closure(J)
其中:I为蕴含某一我的项目集的状态。
X为一文法符号,X∈Vn∪Vt
J={任何形如A->•X的我的项目|A->X•属于I}
3、ACTION子表和GOTO子表的结构
a.若我的项目A→.a属于Ik且GO (Ik, a)= Ij, a为终结符,则置ACTION[k, a]为“把状态j和符号a移进栈”,简记为“sj”;
b.若我的项目A→.属于Ik,那么,对任何终结符a,置ACTION[k,a]为“用产生式A→进行规约”,简记为“rj”;其中,假设A→为文法G'的第j个产生式
c.若我的项目S'→S.属于Ik, 则置ACTION[k, #]为“承受”,简记为“acc”;
d.若GO (Ik, A)= Ij, A为非终结符,则置GOTO[k, A]=j;
e.剖析表中凡不能用上述1至4填入信息的空白格均置上“出错标记”。 按上述算法结构的含有ACTION和GOTO两局部的剖析表,如果每个入口不含多重定义,则称它为文法G的一张LR(0)剖析表。具备LR(0)表的文法G称为一个LR(0)文法,LR(0)文法是无二义的。
四、试验思路
本次试验采纳python实现。
1、输出
结构一个LR类,输出非终结符,终结符,开始符以及产生式别离存于LR类的成员:Vn,Vt,start,production。
2、建设我的项目
构造函数Project,依据产生式建设我的项目,对每一条产生式的右部进行解决,顺次在右部的每个终结符和非终结符前增加原点,并在最初增加原点。
3、closure算法
构造函数closure,求一个我的项目的闭包closure。分三种状况探讨,对于S->·和E->·a这两种状况,返回本身。对于E->b·B这种状况,对我的项目的右部进行解决,持续求B->·r闭包,因而这是一个递归函数。最终函数以列表的模式返回每个我的项目集。
4、转向函数GO(I,X)的算法
构造函数GO,求一个我的项目集的GO(I,X)。建设字典go寄存最终后果,对不是S->a·模式的我的项目进行探讨,对我的项目的右部进行解决,将原点后移一位,利用closure函数失去圆点后移失去的我的项目的我的项目集,退出go中。直到解决完该我的项目集的所有我的项目。
5、建设状态及对应的我的项目集
构造函数createDFA,建设状态及对应的我的项目集。首先,从拓广文法的第一个我的项目开始,建设初态,定义number寄存状态编号,初始值为0。设立字典status寄存状态编号及对应的我的项目集。将初态退出一个队列qu中。每次从qu中取出一个状态,求该状态的我的项目集的Go(I,x),再对失去的我的项目集进行判断,若该我的项目集是已知的状态,则不做解决,若该我的项目集是新的状态,则将其退出队列qu中,number加1。每次从qu中取出一个状态反复上述操作,直到队列为空,阐明已求得所有状态。
6、ACTION子表的结构
分两种状况探讨:我的项目集只有一个我的项目和我的项目集不止一个我的项目。对于第一种状况,再分两种状况,看该我的项目是否对应了初态,若是,则将#对应为acc,其余终结符对应为error,若不是,则求得该我的项目去掉圆点之后的产生式的编号i,终结合乎#对应为ri。对于我的项目集不止一个我的项目的状况,顺次对终结符和#寻找在该状态的的GO(I,X)下是否有所对应,有则求得编号对应为Si,没有则对于error。
7、GOTO子表的结构
对于每个状态的GO(I,X)函数进行遍历,寻找是否有对应的终结符,若有则返回对应的我的项目集的编号,若没有则返回error。
五、试验小结
通过本次试验,理解了LR(0)剖析表的结构,对于结构过程所须要的一些算法有了深刻的理解,通过理论的编写程序代码实现LR(0)剖析表的结构,对于程序的编写能力有了肯定的晋升。在试验过程中,次要对于closure闭包函数的结构以及状态的设置有问题。Closure闭包函数用了递归的构造,因而对于递归的完结条件须要标注分明。对于状态的建设,须要留神每次通过GO(I,X)失去的新的我的项目集是否是曾经存在的状态,若是则不做解决。对于状态的遍历应用队列来实现,每次新的状态都退出队列中,队列为空阐明状态遍历结束。有一点问题值得注意,因为状态编号的我的项目集的存储构造应用了字典,字典是无序的构造,因而每次遍历失去的状态编号都不同,程序的每次运行失去的最终LR(0)剖析表不惟一。
六、附件
1、源代码
import copyimport queueclass LR: def __init__(self): self.Vn = [] self.Vt = [] self.start = None # 开始符号 self.production = [] # 产生式 self.project = [] # 我的项目 self.status = {} # 寄存状态编号及对应的我的项目集 self.goto = {} # 寄存goto表 {0:{E:'1',A:'error',B:'error'}} self.action = {} # 寄存action表 {0:{a:'S2',b:'S3'}} def setVn(self): Vn = input('输出非终结符(以空格辨别, 回车完结):') self.Vn = Vn.split(' ') def setVt(self): Vt = input('输出终结符(以空格辨别, 回车完结):') self.Vt = Vt.split(' ') def setS(self): S = input('输出开始符号(以回车完结):') self.start = S def setf(self): # 生成产生式 n = int(input('输出产生式数目:')) print('输出产生式(以回车辨别):') for i in range(n): f = input() self.production.append(f) def Project(self): # 建设我的项目 for f in self.production: temporary = copy.deepcopy(f) # temporary与f雷同 temporary = temporary.split('->') l = temporary[0] # 产生式左部 r = list(temporary[1]) # 产生式右部 for i in range(len(r)+1): # 对产生式右部解决 temporary1 = copy.deepcopy(r) temporary1.insert(i,'·') newf = l+'->'+''.join(temporary1) self.project.append(newf) def closure(self, pro): # 求一个我的项目pro的闭包 E->· E->·b E->b·B 返回列表 temporary = [] # 最终返回的后果 temporary.append(pro) # 将pro本身退出 l1 = pro.split('->')[0] # 左部 r1 = pro.split('->')[1] # 右部 x = list(r1) # 寄存右部的列表 index = x.index('·') # 失去圆点地位 if len(x) == 1: # S->· return temporary else: if index == len(r1)-1 or x[index+1] in self.Vt: #E->·a return temporary else: # E->b·B for elem in range(len(self.project)): l = self.project[elem].split('->')[0] # 左部 r = self.project[elem].split('->')[1] # 右部 if l == x[index+1] and r.startswith('·'): # 持续求B->·r闭包 conlist = self.closure(self.project[elem]) if len(conlist) == 0: pass else: temporary.extend(conlist) return temporary def GO(self, project): # 计算一个我的项目集的GO(I,x),返回字典模式 go = {} # 寄存Go(I,x)后果,模式为{a:[],b:[]} for elem in project: l = elem.split('->')[0] # 我的项目左部 r = elem.split('->')[1] # 我的项目右部 index = list(r).index('·') # 返回·的地位 if not r.endswith('·'): # 不是S->a·模式 if go.get(list(r)[index+1]) == None: # 阐明x所对应的go中没有我的项目 temporary = list(r) temporary.insert(index+2, '·') temporary.remove('·') # 将·后移一位 x = l+'->'+''.join(temporary) # 产生一个残缺的我的项目 go[list(r)[index+1]] = self.closure(x) # 将该我的项目对应的我的项目集退出x的go中 else: # 阐明x所对应的go中已有我的项目 temporary = list(r) temporary.insert(index+2,'·') temporary.remove('·') # 将·后移一位 x = l+'->'+''.join(temporary) # 产生一个残缺的我的项目 go[list(r)[index+1]].extend(self.closure(x)) return go def createDFA(self): # 建设辨认活前缀的DFA number = 0 # 初始状态编号为0 first = 'S->·'+self.start # 初态 x = self.closure(first) # 初态闭包 self.status[number] = x qu = queue.Queue() # 结构队列,用于寄存失去的状态 qu.put({number:self.status[number]}) # 把初始状态退出队列中 number = number+1 while not qu.empty(): # 队列不为空,阐明状态没有遍历结束 temporary = qu.get() # 队列中取出一个状态 for k, v in temporary.items(): y = self.GO(v) # 求我的项目集的Go(I,x) for key, value in y.items(): flag = -1 # 标记位,判断value是否是新的状态 for ke, va in self.status.items(): if set(va) == set(value): flag = ke # 状态已存在,返回状态编号 break if flag == -1: # 新的状态,退出状态集中 self.status[number] = value qu.put({number:self.status[number]}) else: # 已有状态 pass # 不作解决 def GOTO(self): # goto表 for i in range(len(self.status)): self.goto[i] = {} temp = self.GO(self.status[i]) # 每个状态的GO for vn in self.Vn: # 对非终结符遍历 if vn in temp.keys(): # 非终结符存在于状态的Go中 for key, value in self.status.items(): if set(value) == set(temp[vn]): number = key # 记录编号 break self.goto[i][vn] = number else: self.goto[i][vn] = 'error' def ACTION(self): vtx = copy.deepcopy(self.Vt) vtx.append('#') # 终结符加‘#’ for i in range(len(self.status)): self.action[i] = {} if len(self.status[i]) == 1: # 我的项目集只有一个我的项目 if self.status[i][0].startswith('S'): # S->E· for vt in self.Vt: self.action[i][vt] = 'error' self.action[i]['#'] = 'acc' else: # 填写rj的我的项目 E->aA· temp = self.status[i][0].rstrip('·') # 删去我的项目的· E->aA for n in range(len(self.production)): if self.production[n] == temp: m = n+1 # 产生式在G'中下标从1开始 break for vt in vtx: self.action[i][vt] = 'r'+str(m) else: # 填写Sj的我的项目 temp = self.GO(self.status[i]) # 字典模式{a:[],b:[]} for vt in vtx: if vt in temp.keys(): for key, value in self.status.items(): # 确定到哪一个状态 if set(value) == set(temp[vt]): number = key # 返回状态编号 break self.action[i][vt] = 'S'+str(number) else: self.action[i][vt] = 'error' def output(self): # 输入LR(0)剖析表 表格模式 print('LR(0)剖析表'.center(85)) print('状态'.center(5), 'ACTION'.center(50), 'GOTO'.center(30)) print(' '.center(10),end='') for vt in self.Vt: # action print(vt.center(10),end='') print('#'.center(10),end='') for vn in self.Vn: # goto print(vn.center(10),end='') print() # 换行 vtx = copy.deepcopy(self.Vt) vtx.append('#') for i in range(len(self.status)): # 输入每一行 print(str(i).center(10),end='') for vt in vtx: for key in self.action[i]: # {0:{'b':'S1'}} if vt == key: print(self.action[i][key].center(10),end='') break for vn in self.Vn: for key in self.goto[i]: if vn == key: print(str(self.goto[i][key]).center(10),end='') break print() # 换行 def show(self): # 显示各个状态及对应的我的项目集 print('所有状态及对应的我的项目集:') for key, value in self.status.items(): print(key, value)if __name__ == '__main__': a = LR() a.setVn() a.setVt() a.setS() a.setf() a.Project() a.createDFA() a.ACTION() a.GOTO() a.show() a.output()
2、程序运行后果
语法分析表/1.png)
语法分析表/2.png)