[发明专利]一种意图获取方法及系统有效
申请号: | 201910186086.4 | 申请日: | 2019-03-12 |
公开(公告)号: | CN109871543B | 公开(公告)日: | 2023-10-24 |
发明(设计)人: | 魏誉荧 | 申请(专利权)人: | 广东小天才科技有限公司 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F40/30 |
代理公司: | 上海硕力知识产权代理事务所(普通合伙) 31251 | 代理人: | 郭桂峰 |
地址: | 523851 广东省东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 意图 获取 方法 系统 | ||
1.一种意图获取方法,其特征在于,包括:
获取语料集,所述语料集包括多条语料;
根据所述语料集生成正则表达式库,所述正则表达式库包括至少一个正则表达式;
根据所述语料集中的语料生成意图知识图谱;
获取用户输入的当前信息;
根据所述正则表达式库中的正则表达式识别所述当前信息的当前意图;
根据所述当前意图和所述意图知识图谱确定与所述当前意图对应的相关意图。
2.根据权利要求1所述的一种意图获取方法,其特征在于,所述根据所述语料集生成正则表达式库具体包括:
对所述语料集中的每条语料进行分词,并标注分词后词语的词性;
对每条语料进行语法分析,提取每条语料的句式主体;
获取所述句式主体对应的字词的语义槽;
根据每条语料的句式主体、所述句式主体对应的语义槽以及每条语料中剩余的非主体部分生成正则表达式;
将所述语料集中的每条语料对应的正则表达式组合生成正则表达式库。
3.根据权利要求1所述的一种意图获取方法,其特征在于,所述根据所述语料集中的语料生成意图知识图谱具体包括:
提取所述语料集中语料的关键词,并生成语义槽;
根据所述语义槽之间的关系生成意图知识图谱。
4.根据权利要求3所述的一种意图获取方法,其特征在于,所述根据所述语义槽之间的关系生成意图知识图谱具体包括:
对所述语义槽进行分类组合,生成至少一个大类意图;
根据每个大类意图中的语义槽之间的关系生成每个大类意图对应的意图知识图谱;
所述根据所述当前意图和所述意图知识图谱确定与所述当前意图对应的相关意图具体包括:
根据所述当前意图确定目标大类意图;
根据所述当前意图和所述目标大类意图对应的意图知识图谱,确定与所述当前意图对应的相关意图。
5.根据权利要求3所述的一种意图获取方法,其特征在于,所述提取所述语料集中语料的关键词,并生成语义槽之后,所述根据所述语义槽之间的关系生成意图知识图谱之前还包括:
统计所述关键词在所述语料集中出现的频率;
所述根据所述语义槽之间的关系生成意图知识图谱之后还包括:
根据所述关键词的频率在所述意图知识图谱中标记节点的权重;
所述根据所述当前意图和所述意图知识图谱确定与所述当前意图对应的相关意图具体包括:
在所述意图知识图谱中查找到与所述当前意图匹配的目标节点;
根据与所述目标节点相关的节点的权重,确定与所述当前意图对应的相关意图。
6.一种意图获取系统,其特征在于,包括:
语料集获取模块,用于获取语料集,所述语料集包括多条语料;
正则表达式生成模块,用于根据所述语料集生成正则表达式库,所述正则表达式库包括至少一个正则表达式;
知识图谱生成模块,用于根据所述语料集中的语料生成意图知识图谱;
信息获取模块,用于获取用户输入的当前信息;
意图识别模块,用于根据所述正则表达式库中的正则表达式识别所述当前信息的当前意图;
相关意图获取模块,用于根据所述当前意图和所述意图知识图谱确定与所述当前意图对应的相关意图。
7.根据权利要求6所述的一种意图获取系统,其特征在于,所述正则表达式生成模块包括:
分词标注单元,用于对所述语料集中的每条语料进行分词,并标注分词后词语的词性;
句式主体提取单元,用于对每条语料进行语法分析,提取每条语料的句式主体;
语义槽获取单元,用于获取所述句式主体对应的字词的语义槽;
正则表达式生成单元,用于根据每条语料的句式主体、所述句式主体对应的语义槽以及每条语料中剩余的非主体部分生成正则表达式;
组合单元,用于将所述语料集中的每条语料对应的正则表达式组合生成正则表达式库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东小天才科技有限公司,未经广东小天才科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910186086.4/1.html,转载请声明来源钻瓜专利网。