[发明专利]一种短文本实体链接方法、装置、计算设备与存储介质在审
申请号: | 202110585951.X | 申请日: | 2021-05-27 |
公开(公告)号: | CN113326383A | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 杨依莹;周凯捷 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/279;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强 |
地址: | 518000 广东省深圳市福田区益田路5033号*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 实体 链接 方法 装置 计算 设备 存储 介质 | ||
本申请提供一种短文本实体链接方法、装置、计算设备与存储介质。本申请使用WideDeep模型,同时捕捉短文本中的语义知识和专业特征知识,解决垂直领域中的实体链接问题。将实体与候选实体输入WideDeep模型的深度网络DeepNet中获取语义相似度;将实体的特征信息与候选实体的属性信息输入WideDeep模型的广度网络WideNet中获取特征相似度。提出了保险垂直领域的实体链接解决方案,提升了专业领域内实体链接任务的预测性能。
技术领域
本申请涉及计算机技术领域,尤其涉及一种短文本实体链接方法、装置、计算设备与存储介质。
背景技术
知识图谱的实体链接指将文本中的某些字符串映射到知识图谱对应的节点实体上。实体链接可分为实体识别和实体消歧两部分。由于保险领域图谱节点的一词多义现象普遍,实体消歧是需要解决的主要难点。
行业内常用的方法主要有以下两种:一是通过深度神经网络计算字符串和知识图谱中实体的字面相似度选择最高分实体,但对语义信息考虑不足。二是结合文本的上下文与图谱知识进行深度神经网络匹配,即将文本与图谱节点通过一个深度网络进行匹配,深度网络对文本上下文信息和图谱信息挖掘比较充分,因此在通用领域效果较好,但在垂直领域性能一般。
发明内容
本申请提出了创新的实体链接模型,在使用深度神经网络捕捉语义信息的基础上,通过WideDeep模型引入了保险领域的专业知识特征,提升了垂直领域的实体链接效果。作为保险领域知识库问答(Knowledge Base Question Answering,KBQA)系统的实体识别模块,可以解决用户问句中的保险产品名与知识图谱中标准产品的链接问题。
第一方面,本申请提供一种实体链接方法,应用于保险领域问答系统,包括获取第一实体和至少一个候选实体;将第一实体与目标候选实体输入WideDeep模型的深度网络DeepNet中,提取第一实体和目标候选实体的语义特征,至少一个候选实体包括目标候选实体;将第一实体的特征信息与目标候选实体的属性信息输入WideDeep模型的广度网络WideNet中,提取第一实体和目标候选实体的属性特征;获取WideDeep模型的输出结果,根据输出结果将第一实体链接到至少一个候选实体中的一个。
深度神经网络具有更好的泛化能力,对语义信息泛化更强;单层神经网络具有更好的记忆能力,对稀疏特征建模更准确,在垂直领域的实体链接问题中获得更好的性能。通过单层神经网络交互匹配问句中的特征信息与知识图谱节点中的属性信息使得模型对专业知识具有更好的记忆能力。作为KBQA系统的实体链接模型,解决用户问句中的保险产品名与知识图谱中标准产品的链接问题。通过对知识图谱中保险产品的属性与用户问句中特征信息求取交叉特征,获得实体与候选实体的特征匹配度信息。
在一种可能的实现方式中,输出结果包括第一实体与目标候选实体的相似度得分,根据相似度得分将第一实体链接到候选实体中的第二实体,第二实体为候选实体中与第一实体相似度得分最高的实体。
通过相似度得分评估第一实体与每个候选实体之间的相似程度,选择相似度得分最高的候选实体作为实体链接结果。
在一种可能的实现方式中,相似度得分包括:获取第一实体在DeepNet的输出结果和特征信息在WideNet的输出结果进行均值拼接得到第一词向量,获取每个候选实体在DeepNet的输出结果和属性信息在WideNet的输出结果进行均值拼接得到第二词向量;计算第一词向量与第二词向量的余弦相似度,得到第一实体与每个候选实体的相似度得分。
将深度神经网络与单层神经网络的词向量进行均值拼接,拼接后词向量中同时包含了语音信息与特征信息,此时计算实体与候选实体的余弦相似度可以综合语义相似度和特征相似度
在一种可能的实现方式中,获取第一实体和至少一个候选实体包括:获取用户的查询命令;根据知识图谱构建AC状态机;将第一文本输入AC状态机,输出第一实体和知识图谱中与第一实体匹配的至少一个候选实体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110585951.X/2.html,转载请声明来源钻瓜专利网。