[发明专利]一种知识图谱中实体更新的方法、装置和服务器有效
申请号: | 201810800674.8 | 申请日: | 2018-07-20 |
公开(公告)号: | CN110019840B | 公开(公告)日: | 2021-06-15 |
发明(设计)人: | 王策 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/9535 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 贾允;肖丁 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 知识 图谱 实体 更新 方法 装置 服务器 | ||
1.一种知识图谱中实体更新的方法,其特征在于,包括:
获取热词集合;
在所述知识图谱中查询所述热词集合中每个热词对应的实体,得到所述每个热词对应的查询结果;
若所述查询结果为空,则根据对应的热词生成虚拟候选实体,所述虚拟候选实体的最后更新时间被设置为预设值,以使得所述虚拟候选实体的优先度最高;
获取全部所述查询结果中各个实体的实体热度;
根据所述实体热度大于预设热度阈值的所述实体以及所述虚拟候选实体,得到候选实体集合;
获取用于计算所述优先度的各个影响因子;所述优先度为数值化形式表示的候选实体被更新的必要程度;所述影响因子包括实体名称的时下热度、实体的属性数量、实体的链接数量、实体的类型、实体既往被编辑次数和实体被访问的次数;
将各个所述影响因子数值化得到影响值;
根据所述影响值得到预测更新频率值;所述预测更新频率值反映实体的需要被更新的概率;
根据当前时间、所述预测更新频率值以及候选实体的最后更新时间计算所述候选实体的优先度;
根据所述优先度在所述候选实体集合中选择目标实体,并更新所述目标实体。
2.根据权利要求1所述的方法,其特征在于,所述获取热词集合还包括:
判断热词集合中的热词数量是否达到预设的数量阈值,若未达到,则对热词集合中的热词进行扩展,并以扩展结果作为最终得到的热词集合。
3.根据权利要求1所述的方法,其特征在于,所述根据优先度在所述候选实体集合中选择目标实体包括:
按照优先度由高到低的顺序对所述候选实体集合中的候选实体进行排序,得到候选实体列表;
获取目标数量N;
选择所述候选实体列表中的前N个候选实体作为目标实体。
4.根据权利要求1所述的方法,其特征在于,所述根据优先度在所述候选实体集合中选择目标实体包括:
获取优先度阈值;
将所述候选实体集合中优先度不小于所述优先度阈值的候选实体作为目标实体。
5.一种知识图谱中实体更新的装置,其特征在于,包括:
热词集合获取模块,用于获取热词集合;
候选实体集合获取模块,用于在所述知识图谱中查询所述热词集合中每个热词对应的实体,得到所述每个热词对应的查询结果;若所述查询结果为空,则根据对应的热词生成虚拟候选实体,所述虚拟候选实体的最后更新时间被设置为预设值,以使得所述虚拟候选实体的优先度最高;获取全部所述查询结果中各个实体的实体热度;根据所述实体热度大于预设热度阈值的所述实体以及所述虚拟候选实体,得到候选实体集合;
优先度获取模块,用于获取用于计算所述优先度的各个影响因子;所述优先度为数值化形式表示的候选实体被更新的必要程度;所述影响因子包括实体名称的时下热度、实体的属性数量、实体的链接数量、实体的类型、实体既往被编辑次数和实体被访问的次数;将各个所述影响因子数值化得到影响值;根据所述影响值得到预测更新频率值;所述预测更新频率值反映实体的需要被更新的概率;根据当前时间、所述预测更新频率值以及候选实体的最后更新时间计算所述候选实体的优先度;
目标实体处理模块,用于根据所述优先度在所述候选实体集合中选择目标实体,并更新所述目标实体。
6.一种服务器,其特征在于,所述服务器用于运行权利要求5所述的一种知识图谱中实体更新的装置。
7.一种终端,其特征在于,所述终端用于运行权利要求5所述的一种知识图谱中实体更新的装置。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有程序,所述程序由相关硬件执行以实现如权利要求1-4中任意一项所述的知识图谱中实体更新的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810800674.8/1.html,转载请声明来源钻瓜专利网。