[发明专利]一种语义处理方法和系统有效
| 申请号: | 201910576758.2 | 申请日: | 2019-06-28 |
| 公开(公告)号: | CN110276080B | 公开(公告)日: | 2023-10-17 |
| 发明(设计)人: | 马勇强;郭敬;陈伟 | 申请(专利权)人: | 第四范式(北京)技术有限公司 |
| 主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/253;G06F40/289;G06F40/242;G06F16/33;G06F16/332;G06F16/36 |
| 代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 田方;曾世骁 |
| 地址: | 100085 北京市海淀区上*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 语义 处理 方法 系统 | ||
提供了一种语义处理方法和系统。所述方法包括:获取输入语句;获得针对所述输入语句的至少一种候选语义组合结果;按照预设规约语法对每种候选语义组合结果执行语法规约,确定所述输入语句的中心话题并生成以中心话题为根节点的语义树;依据预设排序规则对所获得的所有语义树中的至少部分语义树进行排序,基于语义树的排序结果选择一个语义树作为最终语义处理结果。
技术领域
本申请涉及自然语言处理技术领域,更具体地讲,涉及一种语义处理方法和系统。
背景技术
现有的针对诸如查询、知识问答、搜索等业务的语义处理技术通常是面向业务的,将许多常见的需求用模板的方式固定下来。这种模板方案的缺陷是在面对需求非常复杂或者由几个基础需求组合生成的嵌套需求时就会失效或者需要重新补充新的模板。
此外,目前市面上的方案普遍都是假设用户的问题中只有一个中心实体,且结果意图也只有唯一,如“A公司的注册资本”,可能无法支持对“A公司和B公司的注册资本”或者“A公司的注册资本和CEO”的查询。查询粒度的局限导致了使用方式的局限。
另一方面,例如,现有的智能问答系统中所使用的语义处理的模板方案由于依赖模板、过度依赖语法依存结果、系统设计简单等问题,导致对于问答系统中的一些复杂语义操作需求无法很好地扩展支持,如“最大”、“最小”、“平均”等。
而近来出现的纯基于深度学习的方案则由于学习方式的黑箱性,导致系统结果的产生是不可控的,即使结果对了,其对于“为什么正确”或者“为什么错了”也很难回答。目前公开的很多基于深度学习端到端的方法对数据的依赖性很强,由于其需要学习的假设空间太大,需要大量的标注数据才能够有一定的效果,并且公开的大多方法都是面向某个特定领域(如金融领域) 提出的一些方案,如果更换了领域,则需要重新调整方法或者重新标注数据新训练一个模型。
因此,亟需一种能够从非结构化的自然语言识别查询意图且能够适应于多个领域的语义处理方案。
发明内容
为了解决上述问题中的至少部分问题,本发明提供了一种语义处理方法和系统。
根据本发明的实施例,提供了一种语义处理方法。所述方法包括:获取输入语句;获得针对所述输入语句的至少一种候选语义组合结果;按照预设规约语法对每种候选语义组合结果执行语法规约,确定所述输入语句的中心话题并生成以中心话题为根节点的语义树;依据预设排序规则对所获得的所有语义树中的至少部分语义树进行排序,基于语义树的排序结果选择一个语义树作为最终语义处理结果。
可选地,所述获得针对所述输入语句的至少一种候选语义组合结果的步骤可包括:使用至少一种分词器对所述输入语句执行分词,获得至少一种分词结果;对每种分词结果中的词语或短语执行语义识别,获得至少一种语义识别结果;对所述至少一种语义识别结果执行语义消歧处理,获得针对所述输入语句的至少一种候选语义组合结果。
可选地,所述方法还可包括:基于特定图数据库执行语义预处理,建立搜索系统,其中,所述搜索系统包括基于所述特定图数据库所生成的分词词典和语义结构集合,并提供实体链接服务,其中,执行分词的步骤包括:基于所述分词词典,使用所述至少一种分词器对输入语句执行分词,并且执行语义识别的步骤包括:基于所述语义结构集合来确定每种分词结果中的词语或短语的语义,并基于识别出的语义,通过使用实体链接服务将每种分词结果中的实体词语或短语链接到与所述特定图数据库对应的知识图谱中的对应实体节点。
可选地,执行语义预处理的步骤还可包括:对所述分词词典中的分词项进行语义扩展,获得分词项的扩展表达,其中,每个扩展表达与和该扩展表达对应的分词项对应相同的语义结构,其中,执行分词的步骤包括:基于分词词典中的分词项以及分词项的扩展表达,使用所述至少一种分词器对输入语句执行分词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于第四范式(北京)技术有限公司,未经第四范式(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910576758.2/2.html,转载请声明来源钻瓜专利网。





