[发明专利]实体标注方法、意图识别方法及对应装置、计算机存储介质有效
申请号: | 201710655187.2 | 申请日: | 2017-08-03 |
公开(公告)号: | CN109388793B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 胡于响 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F16/36 |
代理公司: | 广州铸智知识产权代理有限公司 44886 | 代理人: | 徐瑞红 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实体 标注 方法 意图 识别 对应 装置 计算机 存储 介质 | ||
本发明提供了一种实体标注方法、意图识别方法及对应装置、计算机存储介质。其中实体标注方法包括:利用知识图谱对句子中至少部分词语的属性标签进行词编码,得到至少部分词语的第一表达向量;基于句子结构对所述句子中至少部分词语进行词编码,得到至少部分词语的第二表达向量;将第一表达向量和第二表达向量进行融合,得到对所述句子的实体标注结果。意图识别方法包括:利用知识图谱对句子中至少部分词语的属性标签进行组合编码,得到所述句子的第一句向量;基于句子结构对所述句子进行编码,得到所述句子的第二句向量;将所述句子的第一句向量和第二句向量进行融合,得到对所述句子的意图识别结果。本发明提供的方式能够提高实体标注和意图识别的准确性。
【技术领域】
本发明涉及计算机应用技术领域,特别涉及一种实体标注方法、意图识别方法及对应装置、计算机存储介质。
【背景技术】
自然语言处理是人工智能的一个重要甚至核心的部分,其目的是理解一句话要表达什么,主要包含两大任务:实体标注和意图识别。其中实体标注是标注一句话中实体词的属性标签,意图识别是识别一句话想要实现什么意图或目的。举个例子,如果有这么一句话“周杰伦演过哪些电影”,实体标注的任务是把实体词“周杰伦”标记为Movie_actor标签,Movie_actor指代影视演员;而意图识别是识别该句话是要获取一个演员演过哪些电影。
目前的实体标注和意图识别方法都只是基于句子结构,这种单纯基于句子结构的方式往往会造成意图识别和实体标注准确率低等问题。
【发明内容】
有鉴于此,本发明提供了一种实体标注方法、意图识别方法及对应装置、计算机存储介质,以便于提高实体标注和意图识别的准确率。
具体技术方案如下:
本发明提供了一种实体标注方法,该方法包括:
利用知识图谱对句子中至少部分词语的属性标签进行词编码,得到至少部分词语的第一表达向量;
基于句子结构对所述句子中至少部分词语进行词编码,得到至少部分词语的第二表达向量;
将第一表达向量和第二表达向量进行融合,得到对所述句子的实体标注结果。
本发明还提供了一种意图识别方法,该方法包括:
利用知识图谱对句子中至少部分词语的属性标签进行组合编码,得到所述句子的第一句向量;
基于句子结构对所述句子进行编码,得到所述句子的第二句向量;
将所述句子的第一句向量和第二句向量进行融合,得到对所述句子的意图识别结果。
本发明提供了一种实体标注装置,其特征在于,该装置包括:
第一词编码单元,用于利用知识图谱对句子中至少部分词语的属性标签进行词编码,得到至少部分词语的第一表达向量;
第二词编码单元,用于基于句子结构对所述句子中至少部分词语进行词编码,得到至少部分词语的第二表达向量;
向量融合单元,用于将第一表达向量和第二表达向量进行融合,得到对所述句子的实体标注结果。
本发明还提供了一种意图识别装置,该装置包括:
第一句编码单元,用于利用知识图谱对句子中至少部分词语的属性标签进行组合编码,得到所述句子的第一句向量;
第二句编码单元,用于基于句子结构对所述句子进行编码,得到所述句子的第二句向量;
向量融合单元,用于将所述句子的第一句向量和第二句向量进行融合,得到对所述句子的意图识别结果。
本发明提供了一种设备,包括
存储器,包括一个或者多个程序;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710655187.2/2.html,转载请声明来源钻瓜专利网。