[发明专利]一种语法分析和词汇辨析的方法在审
申请号: | 202310504117.2 | 申请日: | 2023-05-06 |
公开(公告)号: | CN116644741A | 公开(公告)日: | 2023-08-25 |
发明(设计)人: | 李熙;张海明 | 申请(专利权)人: | 北京奇峰天下科技有限公司 |
主分类号: | G06F40/253 | 分类号: | G06F40/253;G06F40/30;G06F40/284;G06F40/211;G06F16/35;G06N20/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100010 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语法分析 词汇 辨析 方法 | ||
本发明提出了一种通过语义树和语法逻辑解析器对文本进行语法分析的方法及系统,实现自动识别句子核心结构、成分分类、成分间修饰关系、词性、准确词义等。该方法直接基于语法规则及教学大纲,提高了句子成分识别的准确性,同时实现了自动为句子打上语法成分标签,提高了分析效率。通过结合机器学习,让AI更好地掌握语法分析模型,有效提升自然语言处理技术水平。具体实施方式包括编写适用于多种语言的语法分析算法,设计描述语法知识点及其层次关系的脚本系统,设计解析器进行句子成分分析,结合教学大纲进行难度评定。
技术领域
本发明属于自然语言处理技术领域,特别是涉及到语法分析、句子结构识别及语法知识点提取方面的技术。是关于一种通过语义树和语法逻辑解析器对文本进行语法分析的方法及系统,具体表现为自动识别句子核心结构、成分分类、成分间修饰关系、词性、准确词义等,进而实现对文本的深入理解与更高效的机器学习训练。
背景技术
随着计算机科学及自然语言处理技术的快速发展,计算机对文本信息的处理能力不断增强。语法分析是自然语言处理中重要的环节。传统基于规则的语法分析方法局限性很大,主要表现在难以针对复杂多变的实际数据进行准确分析。近年来,基于机器学习的方法逐渐受到广泛关注。然而,现有的技术主要基于统计模型,缺乏对语法规则及教学大纲的直接表达,对句子成分的识别及难度评定仍有局限。
发明内容
针对现有技术中的上述不足,本发明提出了一种全新的语法分析方法和系统,能够更为准确地判断句子成分、修饰关系、词性、词义、知识点分级等,并具备更高的处理效率。主要包括以下几个创新内容:
(1)通过语法树以及语法逻辑解析器,编译确认各种语言文本中句子主体的核心结构,如主体(主语)、执行动作(谓语动词)、执行结果或对象(宾语),并得出其他成分的修饰层级关系(2)根据权利要求1确认其他句子元素组合对应的成分,如定语、状语、补语、从句等。确认每个单词或文字在当前句子语境中的词性和解释。(3)自动为任何句子打上语法成分标签,再与机器学习相结合,让AI掌握语法成分模型,基于机器学习的模型再分析句子,提高效率。与现有技术相比,本发明具有以下优点和特点:a)直接基于语法规则及教学大纲,提高了句子成分识别的准确性。b)实现了自动为句子打上语法成分标签,提高了分析效率。c)与机器学习相结合,让AI更好地掌握语法分析模型,有效提升自然语言处理技术水平。
发明步骤
本发明的技术方案包括以下几个步骤:a)以现有的NLP生成的token语法树为基础,设计一套用于识别句子成分的算法。
实施方式
具体实施方式包括:a)编写一套适用于多种语言的语法分析算法。b)设计一套能够描述语法知识点及其层次关系的脚本系统。c)设计解析器,能够根据脚本及语法树进行句子成分的分析。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇峰天下科技有限公司,未经北京奇峰天下科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310504117.2/2.html,转载请声明来源钻瓜专利网。