[发明专利]一种语法分析和词汇辨析的方法在审

专利信息
申请号: 202310504117.2 申请日: 2023-05-06
公开(公告)号: CN116644741A 公开(公告)日: 2023-08-25
发明(设计)人: 李熙;张海明 申请(专利权)人: 北京奇峰天下科技有限公司
主分类号: G06F40/253 分类号: G06F40/253;G06F40/30;G06F40/284;G06F40/211;G06F16/35;G06N20/00
代理公司: 暂无信息 代理人: 暂无信息
地址: 100010 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 语法分析 词汇 辨析 方法
【说明书】:

发明提出了一种通过语义树和语法逻辑解析器对文本进行语法分析的方法及系统,实现自动识别句子核心结构、成分分类、成分间修饰关系、词性、准确词义等。该方法直接基于语法规则及教学大纲,提高了句子成分识别的准确性,同时实现了自动为句子打上语法成分标签,提高了分析效率。通过结合机器学习,让AI更好地掌握语法分析模型,有效提升自然语言处理技术水平。具体实施方式包括编写适用于多种语言的语法分析算法,设计描述语法知识点及其层次关系的脚本系统,设计解析器进行句子成分分析,结合教学大纲进行难度评定。

技术领域

本发明属于自然语言处理技术领域,特别是涉及到语法分析、句子结构识别及语法知识点提取方面的技术。是关于一种通过语义树和语法逻辑解析器对文本进行语法分析的方法及系统,具体表现为自动识别句子核心结构、成分分类、成分间修饰关系、词性、准确词义等,进而实现对文本的深入理解与更高效的机器学习训练。

背景技术

随着计算机科学及自然语言处理技术的快速发展,计算机对文本信息的处理能力不断增强。语法分析是自然语言处理中重要的环节。传统基于规则的语法分析方法局限性很大,主要表现在难以针对复杂多变的实际数据进行准确分析。近年来,基于机器学习的方法逐渐受到广泛关注。然而,现有的技术主要基于统计模型,缺乏对语法规则及教学大纲的直接表达,对句子成分的识别及难度评定仍有局限。

发明内容

针对现有技术中的上述不足,本发明提出了一种全新的语法分析方法和系统,能够更为准确地判断句子成分、修饰关系、词性、词义、知识点分级等,并具备更高的处理效率。主要包括以下几个创新内容:

(1)通过语法树以及语法逻辑解析器,编译确认各种语言文本中句子主体的核心结构,如主体(主语)、执行动作(谓语动词)、执行结果或对象(宾语),并得出其他成分的修饰层级关系(2)根据权利要求1确认其他句子元素组合对应的成分,如定语、状语、补语、从句等。确认每个单词或文字在当前句子语境中的词性和解释。(3)自动为任何句子打上语法成分标签,再与机器学习相结合,让AI掌握语法成分模型,基于机器学习的模型再分析句子,提高效率。与现有技术相比,本发明具有以下优点和特点:a)直接基于语法规则及教学大纲,提高了句子成分识别的准确性。b)实现了自动为句子打上语法成分标签,提高了分析效率。c)与机器学习相结合,让AI更好地掌握语法分析模型,有效提升自然语言处理技术水平。

发明步骤

本发明的技术方案包括以下几个步骤:a)以现有的NLP生成的token语法树为基础,设计一套用于识别句子成分的算法。 附图说明:图1是附图1-语法树token的结构。b)发明一套用于表达语法知识点的脚本,并实现对脚本的解释、编译、执行,输出正确的结果。 图说明:图2是附图2-脚本编译和执行。c)结合教学大纲,进行文章难度级别的评定。 附图说明:图3是附图3-文章级别评定。d)实现自动为句子打上语法成分标签,与机器学习相结合,让AI掌握语法成分模型。基于机器学习的模型再分析句子,效率得到大幅提升。 附图说明:图4是附图4-机器学习标签1;图5是附图5-机器学习标签2。

实施方式

具体实施方式包括:a)编写一套适用于多种语言的语法分析算法。b)设计一套能够描述语法知识点及其层次关系的脚本系统。c)设计解析器,能够根据脚本及语法树进行句子成分的分析。 附图说明:图6是附图6-单词词性分析。d)设计难度评定模块,结合教学大纲进行文章难度级别的评定。 附图说明:图7是附图7-基于知识点和单词难度判定文章难度。e)设计自动为句子打上语法成分标签的模块,并基于机器学习的算法实现语法分析模型的自动优化。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇峰天下科技有限公司,未经北京奇峰天下科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202310504117.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top