[发明专利]一种基于HTML文法树的FrontPage操作阅卷方法无效
| 申请号: | 200810060941.9 | 申请日: | 2008-04-08 |
| 公开(公告)号: | CN101261632A | 公开(公告)日: | 2008-09-10 |
| 发明(设计)人: | 胡维华;谢红标 | 申请(专利权)人: | 杭州电子科技大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 杭州求是专利事务所有限公司 | 代理人: | 张法高 |
| 地址: | 310018浙江省*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 html 文法 frontpage 操作 阅卷 方法 | ||
技术领域
本发明属于计算机应用技术领域,特别是涉及一种静态网页制作工具操作正确性验证的方法。
背景技术
IT技能测评中有一项评测静态网页制作工具的技能考核。如何快速有效地检测操作者熟悉FrontPage工具的使用,存在着一定的难点,因为对于同样的效果,HTML标签序列可能是多样的。
目前,进行此类正确性检查的方法主要是编写多种可能的HTML标签序列,在HTML文档中以字符串匹配的方式来检查是否操作正确,此方法存在答案编写繁琐,匹配时间长等缺陷。
发明内容
本发明的目的在于针对现有技术的不足,提供一种基于HTML文法树的FrontPage操作阅卷方法。
本发明解决其技术问题采用的技术方案如下:
1)采用XML格式将HTML文件转化为HTML文法树,具体方法是:
首先分析待验证的HTML文件,去除脚本(如广告代码、VBScript和JavaScript等脚本)等无用标签信息;
然后由于HTML语法结构比较松散不便于分析,在去除无用标签信息的基础上我们采用HTML对称性分析处理算法,消除HTML文件中不严格的语法;
其次在得到了语法格式良好的HTML文件后,把HTML文件转化为XML文件;
最后把XML文件转化为HTML文法树,便于后续的操作正确性判断。
2)采用深度遍历法在考生HTML文件转化的文法树中查找是否存在相似于答案HTML文法树的子树来进行操作正确性判断,具体方法是:
首先采用1)中的方法把答案HTML语句块和考生HTML文件转换为HTML文法树,分别记为HTML文法树A和HTML文法树D;
然后在HTML文法树D中采用深度遍历法比较查找是否有相似于HTML文法树A的子树。
2)中比较查找是否有相似于HTML文法树A的子树的具体方法是:
首先,比较树A和树B的根节点是否相同,不同则返回相似度0同时退出比较;
然后,如果树A和树B的根节点相同,则分别获取树A和树B的子节点集,并进行清理;
其次,计算两子节点集中各对应节点的相似度;
最后,按照权重策略计算得到树A和树B的相似度。
本发明是一种基于HTML文法树的FrontPage操作阅卷方法,其主要功能是通过该方法以HTML文法树作为静态网页制作工具操作正确性的检验对象,运用深度遍历查找和树相似度比较算法,验证考生操作的正确性。本方法实现静态网页制作工具操作的正确性自动验证,为计算机对静态网页制作工具操作正确性的自动测评提供了方法保障。
(1)语法形式化。HTML文法树是HTML结构的树状表示,具有形式化、规范化的优点,便于分析HTML结构的相似性,进而验证考生操作的正确性。
(2)准确性。采用树相似度比较算法,以是否存在相似子树的方式来判断正确性,比传统的文本比较方法更加快速、准确和合理。
具体实施方式
1方法中涉及到相关的定义及说明:
两棵树A和B的相似度基本准则如下:
1)如果树A=树B,则树A和树B的相似度为1。
2)如果树A的根节点≠树B的根节点,则树A和树B的相似度为0;
3)如果树A的根节点=树B的根节点,则树A和树B的相似度>0
说明:
树A=树B,表示树A和树B完全相同;
定义1(树相似度)
2HTML对称性分析处理算法
以带头结点的线性链表L作为存储结构,依次读入HTML文件中的字符,判断标签是否匹配,从而补全漏缺标签和删除无用标签,具体算法如下:
第一步,从HTML文件中读入字符a,判断字符a是“<”,还是“</”,如果a是“<”则转步骤二,是“</”则转步骤三;
第二步,将从字符“<”到“>”的标签内容作为链表L的一个元素,并依次记载出现的在每一个“<>”中的每一个字符串,转步骤一继续进行处理;
第三步,则将此结束标记的内容与链表L的最后一个元素的内容进行比较,若相同,表示此起始标记和读入的结束标记符合XML语法,则删除L中的这个元素,如果不相同则依次与L中当前元素的父节点比较,直到找到相同的节点元素。这种情况表明找到的起始标记和读入的结束标记中间的元素不是逐层嵌套的,需要在找到的起始标记和读入的结束标记中间的元素中增加相应的结束标记,如果找不到转步骤四;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810060941.9/2.html,转载请声明来源钻瓜专利网。





