[发明专利]一种实体演进规律推荐方法及装置有效
申请号: | 202110938544.2 | 申请日: | 2021-08-16 |
公开(公告)号: | CN113836289B | 公开(公告)日: | 2023-06-09 |
发明(设计)人: | 杜军平;黄恩一;薛哲;徐欣 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F16/33;G06F16/35;G06F16/901 |
代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 徐雅琴 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 实体 演进 规律 推荐 方法 装置 | ||
1.一种实体演进规律推荐方法,其特征在于,包括:
根据输入的实体关键词,搜索获得与所述实体关键词有关的搜索内容;其中,所述搜索内容包括实体标题和实体内容;
对所述搜索内容进行语义扩展,得到语义扩展后的搜索内容,包括:计算所述实体标题和所述实体内容的Jaccard距离;响应于所述Jaccard距离大于预设的第一距离阈值,同时小于预设的第二距离阈值,根据所述实体内容对所述实体标题进行扩展,得到所述语义扩展后的搜索内容;
从所述语义扩展后的搜索内容中提取语义特征;
确定所述语义特征之间的语义关联关系;
根据所述语义关联关系构建图结构,基于所述图结构进行聚类,得到至少一个实体组,包括:
根据所述语义关联关系,构建实体二部图;
对于所述实体二部图中的每个实体节点:
计算该实体节点与其他实体节点之间的相似度,将相似度大于预设阈值的其他实体节点保存于该实体节点的相似矩阵中;
根据相似矩阵中的实体节点所构成的图结构,确定所有双连通分量;响应于所述双连通分量满足预设的连通条件,将所述双连通分量的各实体节点归类于该实体节点的实体组;
计算所述实体关键词所在实体组的热度值,根据热度值计算结果输出推荐结果。
2.根据权利要求1所述的方法,其特征在于,从所述语义扩展后的搜索内容中提取语义特征之后,还包括:
对所述语义特征进行特征降维处理,得到降维后的语义特征。
3.根据权利要求1所述的方法,其特征在于,确定所述语义特征之间的语义关联关系为:
以所述语义特征为输入,利用多通道注意力模型输出各语义特征之间的语义关联关系。
4.根据权利要求1所述的方法,其特征在于,响应于双连通分量满足预设的连通条件,将该双连通分量的各实体节点归类于该实体节点的实体组,包括:
响应于所述双连通分量上的节点数量大于预设的上限阈值,对所述双连通分量进行最小分割计算,直至分割后的双连通分量上的节点数量小于等于所述上限阈值;
对于节点数量小于等于所述上限阈值的预处理双连通分量,响应于节点数量小于预设的合理阈值,对所述预处理双连通分量进行最小分割计算,得到合理双连通分量;
将所述合理双连通分量上的实体节点归类于实体组。
5.根据权利要求1所述的方法,其特征在于,计算所述实体关键词所在实体组的热度值,根据热度值计算结果输出推荐结果,包括:
确定所述实体关键词所在实体组中的各实体节点;
根据各实体节点的搜索内容,分别计算各实体节点的热度值;
按照各实体节点的热度值从大到小的顺序输出推荐结果。
6.根据权利要求5所述的方法,其特征在于,所述搜索内容包括时间信息;
所述基于所述图结构进行聚类,得到至少一个实体组,包括:
基于所述图结构和所述时间信息进行聚类,得到至少一个实体组;
所述按照各实体节点的热度值从大到小的顺序输出推荐结果为:
按照各实体节点的热度值从大到小的顺序输出特定时间段内的推荐结果。
7.一种实体演进规律推荐装置,其特征在于,包括:
搜索模块,用于根据输入的实体关键词,搜索获得与所述实体关键词有关的搜索内容;其中,所述搜索内容包括实体标题和实体内容;
语义扩展模块,用于对所述搜索内容进行语义扩展,得到语义扩展后的搜索内容,包括:计算所述实体标题和所述实体内容的Jaccard距离;响应于所述Jaccard距离大于预设的第一距离阈值,同时小于预设的第二距离阈值,根据所述实体内容对所述实体标题进行扩展,得到所述语义扩展后的搜索内容;
特征提取模块,用于从所述语义扩展后的搜索内容中提取语义特征;
语义关联模块,用于确定所述语义特征之间的语义关联关系;
聚类模块,用于根据所述语义关联关系构建图结构,基于所述图结构进行聚类,得到至少一个实体组,包括:根据所述语义关联关系,构建实体二部图;对于所述实体二部图中的每个实体节点:计算该实体节点与其他实体节点之间的相似度,将相似度大于预设阈值的其他实体节点保存于该实体节点的相似矩阵中;根据相似矩阵中的实体节点所构成的图结构,确定所有双连通分量;响应于所述双连通分量满足预设的连通条件,将所述双连通分量的各实体节点归类于该实体节点的实体组;
输出模块,用于计算所述实体关键词所在实体组的热度值,根据热度值计算结果输出推荐结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110938544.2/1.html,转载请声明来源钻瓜专利网。