[发明专利]一种基于知识图谱的语义识别方法及系统有效
申请号: | 201611192705.3 | 申请日: | 2016-12-21 |
公开(公告)号: | CN106776564B | 公开(公告)日: | 2020-04-24 |
发明(设计)人: | 张永成;尹弘 | 申请(专利权)人: | 张永成;尹弘 |
主分类号: | G06F40/30 | 分类号: | G06F40/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 610041 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 图谱 语义 识别 方法 系统 | ||
本发明公开了一种基于知识图谱的语义识别方法及系统,该方法包括:预先构建知识图谱,该知识图谱包括语音层、字层、表示层、语义层及意图层;接收输入信息,将该输入信息转换为语音单元,确定与每个语音单元关联的字单元及与每个字单元关联的表示单元;确定与每个表示单元关联的语义单元,根据每个语义单元与输入信息中位于其对应表示单元对应位置之前的前驱组及之后的后继组之间的关联选取出选定语义单元;确定与每个选定语义单元关联的意图单元,并根据每个意图单元与对应选定语义单元之间的关联由意图单元中选取出选定意图单元,确定该选定意图单元组成的选定意图集合为与输入信息对应的意图。由此,可以对全部自然语言进行语义识别。
技术领域
本发明涉及自然语言处理技术领域,更具体地说,涉及一种基于知识图谱的语义识别方法及系统。
背景技术
在自然语言处理中,语义识别是核心问题,只有完成该项工作,才能有效的识别自然语言输入中的信息,让计算机真正理解文本。简单来说,通过这项工作的实现,计算机可以理解用户通过自然语言形式输入的信息,获取用户输入的数据。
现有技术用于实现语义识别的技术方案一般基于机器学习,具体来说,将整个语义识别过程分为多个步骤,包括分词、词性标注、依存分析、命名实体识别及关键词抽取等,而上述步骤均需使用机器学习的方法,基于标注的上述资料训练对应的语义识别模型,进而将用户输入的信息作为该语义识别模型的输入,即可得到该语义识别模型输出的与用户输入信息对应的语义识别结果。但是发明人发现,由于语义识别模型与用于训练该模型的资料关联,即其仅仅能够识别出与训练该模型的资料对应的自然语言的语义,因此,对于其他自然语言而无法实现其语义识别。
综上所述,现有技术中用于实现语义识别的技术方案存在无法支持与语义识别模型无关联的自然语言的语义识别的问题。
发明内容
本发明的目的是提供一种基于知识图谱的语义识别方法及系统,以解决现有技术中用于实现语义识别的技术方案存在的无法支持与语义识别模型无关联的自然语言的语义识别的问题。
为了实现上述目的,本发明提供如下技术方案:
一种基于知识图谱的语义识别方法,包括:
预先构建知识图谱,该知识图谱包括语音层、字层、表示层、语义层及意图层,语音层、字层、表示层、语义层及意图层的全部层或者部分层中的每层均具有对应的单元;
接收用户输入的输入信息,将该输入信息转换为语音单元,确定与每个语音单元关联的字单元,并确定与每个字单元关联的表示单元;
确定与每个表示单元关联的语义单元,并根据每个语义单元与所述输入信息中位于其对应表示单元对应位置之前的语义单元为前驱组、及之后的语义单元为后继组之间的关联,由所述语义单元中选取出选定语义单元;
确定与每个选定语义单元关联的意图单元,并根据每个意图单元与对应选定语义单元之间的关联由所述意图单元中选取出选定意图单元,确定该选定意图单元组成的选定意图集合为与所述输入信息对应的意图。
优选的,确定与每个语音单元关联的字单元之后及确定与每个字单元关联的表示单元之后,还包括:
将包含第一单元大于对应阈值,但只关联到一个输入信息对应第一单元的第二单元去除,并将关联到的输入信息对应第一单元数量与包含的第一单元数量的比值低于对应阈值的第二单元去除;
其中,第二单元为字单元时,第一单元为语音单元;第二单元为表示单元时,第一单元为字单元。
优选的,选取出所述选定语义单元,包括:
将所述语义单元放入候选集合中,将每个表示单元及对应的语义单元组成与每个表示单元对应的单元组,基于每个单元组的最大前驱置信度及最大后继置信度计算该单元组的语义置信度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于张永成;尹弘,未经张永成;尹弘许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611192705.3/2.html,转载请声明来源钻瓜专利网。