[发明专利]基于知识图谱的检索文本扩展方法及相关装置在审
申请号: | 202010763043.0 | 申请日: | 2020-07-31 |
公开(公告)号: | CN111930891A | 公开(公告)日: | 2020-11-13 |
发明(设计)人: | 刘志慧;金培根;何斐斐;陆林炳;林加新;李炫 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/289;G06F16/36 |
代理公司: | 深圳市隆天联鼎知识产权代理有限公司 44232 | 代理人: | 魏学昊 |
地址: | 518000 广东省深圳市福田区益田路503*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 知识 图谱 检索 文本 扩展 方法 相关 装置 | ||
本申请是关于一种基于知识图谱的检索文本扩展方法及相关装置,属于人工智能技术领域,该方法包括:对接收到的检索文本进行解析,得到所述检索文本中的检索要素;确定所述检索要素的图谱结构类型,并根据所述图谱结构类型确定所述检索要素的扩展规则,所述图谱结构类型表示知识图谱中的数据结构类型,所述扩展规则表示所述知识图谱中检索要素的替换内容查询策略;根据所述扩展规则,利用目标知识图谱查询扩展所述检索要素得到扩展后的检索要素;利用所述扩展后的检索要素替换所述检索文本中的检索要素,得到扩展后的检索文本。本申请有效提升检索文本的多样性,进而有效保证检索内容的完整性和检索深度。
技术领域
本申请涉及人工智能技术领域,具体而言,涉及一种基于知识图谱的检索文本扩展方法及相关装置。
背景技术
随着互联网时代的蓬勃发展,网络上涌现出大量的数据,需要使用检索系统来满足用户所需。召回模块是检索系统必不可少的模块,用于从大量的数据集合中召回小部分数据用于更精准的排序计算。所以召回模块需要在召回的小部分数据中尽可能多而全的返回正确的结果,使后续排序模块能够得到正确的结果。
传统的召回模块大部分使用原始的检索文本或者对检索文本进行简单的同义词替换来进行召回,这样会导致检索文本单一,缺少多样性,很容易丢失掉一些检索内容,且检索内容通常只局限在表面的含义。
发明内容
本申请的目的在于提供一种基于知识图谱的检索文本扩展方案,进而至少在一定程度上有效提升检索文本的多样性,进而有效保证检索内容的完整性和检索深度。
根据本申请的一个方面,提供一种基于知识图谱的检索文本扩展方法,包括:
对接收到的检索文本进行解析,得到所述检索文本中的检索要素;
确定所述检索要素的图谱结构类型,并根据所述图谱结构类型确定所述检索要素的扩展规则,所述图谱结构类型表示知识图谱中的数据结构类型,所述扩展规则表示所述知识图谱中检索要素的替换内容查询策略;
根据所述扩展规则,利用目标知识图谱查询扩展所述检索要素得到扩展后的检索要素;
利用所述扩展后的检索要素替换所述检索文本中的检索要素,得到扩展后的检索文本。
在本申请的一种示例性实施方式中,所述确定所述检索要素的图谱结构类型,并根据所述图谱结构类型确定所述检索要素的扩展规则,包括:
获取所述检索文本的文本特征,所述文本特征为所述检索文本的文本来源场景特征;
根据所述文本特征确定所述检索要素对应的预扩展要素,所述预扩展要素为所述文本来源场景特征下所述扩展要素的修正要素;
根据所述预扩展要素的图谱结构类型,确定所述预扩展要素的扩展规则作为所述检索要素的扩展规则。
在本申请的一种示例性实施方式中,所述获取所述检索文本的文本特征,所述文本特征为所述检索文本的文本来源场景特征,包括:
获取所述检索文本来源的检索场景的场景特征,所述场景特征至少包括检索用户属性特征、检索位置属性特征及检索设备属性特征;
将所述检索场景的场景特征确定为所述检索文本的文本特征。
在本申请的一种示例性实施方式中,所述根据所述文本特征确定所述检索要素对应的预扩展要素,包括:
基于预设的评价模型,获取所述检索文本的第一检索专业性评价值及各所述检索要素的第二检索专业性评价值;
根据所述文本特征及所述第一检索专业性评价值,从预设扩展方向表中查找所述检索文本的扩展方向;
根据所述扩展方向及所述第二检索专业性评价值,从所述预设扩展方向表中查找每个所述检索要素的预扩展要素。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010763043.0/2.html,转载请声明来源钻瓜专利网。