[发明专利]一种自动解析英文文本语法现象的方法在审

专利信息
申请号: 201910088630.1 申请日: 2019-01-30
公开(公告)号: CN111581953A 公开(公告)日: 2020-08-25
发明(设计)人: 戴翰波;李辉;王丽 申请(专利权)人: 武汉慧人信息科技有限公司
主分类号: G06F40/253 分类号: G06F40/253
代理公司: 暂无信息 代理人: 暂无信息
地址: 430000 湖北省武汉市*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 自动 解析 英文 文本 语法 现象 方法
【说明书】:

发明提出了一种对英文文本进行自动解析语法现象的方法,用于对输入的自然语言进行词法和句法两方面的语法分析。根据本发明的语法解析方法,能够结合词性标注、依存句法关系以及正则表达式,实现将输入句子自动解析语法现象,结果映射到我们自己总结归纳的常见的语法知识点组成的语法树上,将所有满足条件的语法现象都输出。基于本发明,可以实现对各种类型的英文读物或英文文本进行相关语法现象的自动解析输出,同时支持语法现象相关内容的扩展开发,如统计文本的句型总数、句型种类及分布,词性特点等。其主要可以应用于初级英语学习者的辅导工作,帮助解析课文文本出现的语法现象,以及相关考试题文本等等,但不仅限于此,涉及需要学习语法现象的英语文本都可以应用。

技术领域

本发明属于自然语言处理技术领域,具体涉及一种基于语法知识的语法现象解析,能够自动解析输入句子的关于词法和句法的语法现象。

背景技术

英语作为全球应用最为普及的一门语言,引起了越来越多人的重视,国内对于英语的教育也愈加普及深化,但英语作为我们第二语言,相比较于母语学习,难免会增添难度,传统的老师教学也并不能完全保障,在我们需要适当的英语语法指导时给予及时的帮助,这时,学习者往往需要一个能够随时辅助他们学习英语文本语法的学习工具。

目前,现有的自然语言处理领域相关的研究,大部分都是针对语言学和教育学上的理论研究,而对于软件应用方面涉及较少。而理论研究的相关成果,又具有特定领域的标记,没有专业知识的人很难理解相关结果,所以,理论研究成果并不能很好的直接适用于英语教育。

自然语言处理领域中,现有的相关理论研究能够对自然语言句子中的单词进行词性标注、引用解析、命名实体识别、依存句法分析以及句子情感分析等等。对自然语言中的句子进行语法分析,虽然涉及到词性标注和依存关系分析,但其中得到的词性标注类别仅有36种,如:JJ表示形容词,CC表示连词,DT表示限定词等,词性标注的类别较宽泛,不能很好的得到单词相关语法现象,同理,依存句法分析类别有49种,如det(x,y):determiner表示x是名词短语,y是其限定词,两者的依赖关系为限定关系,也不能很好的映射出句子的相关语法现象。

现有技术缺少将已有的自然语言处理的相关理论成果进行再处理,直接能够得到常见的语法现象的技术,而且,仅从目前得到的理论成果,不能直接明了的得到所需要的语法现象,仅有较宽泛的单词词性标注和依存句法分析,结果较笼统,不能与平常见到的英语语法相统一起来。因此,自动对英文文本进行语法现象的解析,具有很强的现实意义。

发明内容

鉴于上述情况,本发明提出一种英文文本自动解析语法现象的方法,用于对输入的自然语言进行词法和句法两方面的语法分析。根据本发明的语法解析方法,能够结合词性标注、依存句法关系以及正则表达式,实现将输入句子自动解析语法现象,结果映射到我们自己总结归纳的常见的语法知识点组成的语法树上,将所有满足条件的语法现象都输出。

对于英文文本的自动解析过程,包括数据预处理模块、语法树映射模块以及结果输出模块三大模块,具体技术路线如下所述:

(一)数据预处理模块,利用自然语言处理包,对自然语言文本进行句子分割、字符标记、词性标注、命名实体识别、单词原型解析以及句子依存关系分析等,具体处理流程如下:

A.得到英语文本断句之后的结果,存为列表sentences

B.遍历列表sentences,对每一个句子sentence先调用依存句法分析方法得到树形结构的分析结果,存为dependency,然后对句子中每个单词进行标记,记为token,得到每个token代表的单词形式word,word对应的单词原型lemma,词性标记结果pos,以及命名实体识别结果ner

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉慧人信息科技有限公司,未经武汉慧人信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910088630.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top