[发明专利]基于回溯自动机语法分析的JSAX解析器和解析方法有效
申请号: | 201210118808.0 | 申请日: | 2012-04-20 |
公开(公告)号: | CN102708155A | 公开(公告)日: | 2012-10-03 |
发明(设计)人: | 段振华;张柯柯;王小兵;田聪 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 程晓霞;王品华 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 回溯 自动机 语法分析 jsax 解析 方法 | ||
1.一种基于回溯自动机语法分析的JSAX解析器,在Eclipse环境下对XML文档解析,包括词法分析器,语法分析器和事件处理器,词法分析器负责读取XML文档的内容,将读取的记号输出给语法分析器,语法分析器根据XML规范要求识别输入记号流中的语言结构,将相应的事件信息传递给事件处理器,事件处理器接受解析器传递的所有事件信息并处理,从中发现所需数据,实现对XML文档的解析,并给出解析结果,其中语法分析器是基于自动机构造的,自动机中回溯自动机的结构为五元组,结构为M=(S,∑,δ,q0,F),还包含有一个状态栈用来保存运行的部分历史,其特征在于:所述语法分析器是基于回溯自动机来实现的,所述回溯自动机是改进回溯自动机,具体是对回溯自动机的动作转移规则δ重新定义,该定义为规则性定义,包括:
1)若δ(q,a)=p,即在状态q下,当读入记号a时,将当前状态q压入栈顶,其中a代表需要进行入栈动作的记号;
2)若δ(q,b)=trace,即在状态q下,当读入记号b时,并且状态栈不为空时,弹出状态栈栈顶p,并且控制转向p状态,其中b代表需要进行回溯动作的记号;
3)若δ(q,c)=p,即在状态q下,当读入记号c时,不需要进行栈操作,其中c代表不需要进行栈操作的记号;
4)若δ(q,d),若d是空白字符(空白字符不属于输入字符集,表示字符串结束),则停机并且在q∈F时接受输入字符串,在 时拒绝接受;
5)若δ(q,e)无定义,则停机并拒绝接受输入字符串。
2.根据权利要求1所述的基于回溯自动机语法分析的JSAX解析器,其特征在于:与改进回溯自动机相等价的文法形式为:
A→aβ
其中a∈T(a属于终结符T),β∈{N0∪N1∪N2}(β是零个、一个或者两个非终结符N的串);并且当β中含有两个非终结符时,产生式的结构为:A→aCA,该结构要求产生式右部第二个非终结符和产生式左边的非终结符相同,其中A、C是非 终结符;
该文法的描述能力比正规文法RG强,但比上下文无关文法CFG弱,是CFG的子集,介于RG与CFG之间。
3.根据权利要求2所述的基于回溯自动机语法分析的JSAX解析器,其特征在于:用与改进回溯自动机等价的文法来描述XML语法定义,得到描述XML文档的语法规则,根据这些语法规则构造改进回溯自动机,用改进回溯自动机识别XML文档记号流中的语言结构,判断是否符合语法规范,完成语法分析,同时将相应事件信息传递给事件处理器。
4.根据权利要求3所述的基于回溯自动机语法分析的JSAX解析器,其特征在于:用权利要求2所述的文法形式构建用于描述XML语法定义的语法规则包括:
document::=prolog element Misc*
element::=EmptyElemTag|A
A::=STag B A
Content_item::=CharData|Reference|CDSect|PI|Comment|EmptyElemTag
B::=Content_item B
B::=STag B B
B::=ETag
A::=Miscs
Miscs::=ε|Misc Miscs
其中,document表示XML文档;prolog用来描述声明信息及文档类型声明doctypedecl;element描述的是嵌套的具有层次结构的标记匹配串,要求出现在element中的标记必须正确嵌套和匹配;STag表示开始标记;CharData表示字符数据;Reference表示引用;CDSect表示CDATA段;PI表示处理指令;Comment表示注释;EmptyElemTag表示空元素标记;STag表示开始标记;Misc*表示XML文档中的空白、处理指令及注释;B是一个非终结符,可以替换为结束标记ETag或者STag B B;A是一个非终结符,可以替换为Miscs或者STag B A。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210118808.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:发光拉链
- 下一篇:产生图像传感器的列偏移校正