[发明专利]针对作者消歧的信息处理装置、方法和介质在审
申请号: | 201910384663.0 | 申请日: | 2019-05-09 |
公开(公告)号: | CN111914092A | 公开(公告)日: | 2020-11-10 |
发明(设计)人: | 夏迎炬;郑仲光;孟遥;陈炎 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 唐京桥;刘烨 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 针对 作者 信息处理 装置 方法 介质 | ||
1.一种针对作者消歧的信息处理装置,包括:
图谱构建单元,其配置成基于从文献库中提取的实体及其属性来构建知识图谱,所述实体包括作者实体及其相关联的实体;
遍历单元,其配置成遍历所构建的知识图谱,以获得有关作者的节点序列;
对齐单元,其配置成针对所述节点序列,基于所述属性进行节点对齐;以及
计算单元,其配置成计算对齐的节点序列之间的相似度,其中,根据所计算的相似度进行所述作者消歧。
2.根据权利要求1所述的装置,其中,所述计算单元进一步配置成:
分别计算两个节点序列中对齐的节点之间的相似度,以获得所述节点序列中针对每个节点的相似度;以及
基于所述节点序列中每个节点的权重使用每个节点的相似度来计算所述节点序列之间的相似度。
3.根据权利要求2所述的装置,还包括归一化单元,其配置成对获得的所述节点序列中针对每个节点的相似度进行归一化处理,其中,使用每个节点的归一化的相似度来计算所述节点序列之间的相似度。
4.根据权利要求3所述的装置,其中,当所述节点序列之间的相似度大于预定阈值时,进行所述作者消歧。
5.根据权利要求1所述的装置,其中,所述对齐单元进一步配置成对节点的子节点进行对齐。
6.根据权利要求5所述的装置,其中,所述对齐单元进一步配置成:
对子节点的子属性基于相似度进行排序;以及
按排序后的子属性对所述子节点进行对齐。
7.根据权利要求1所述的装置,其中,所述遍历单元进一步配置成使用深度优先遍历方法或广度优先遍历方法来遍历所述知识图谱。
8.根据权利要求1所述的装置,其中,所述计算单元进一步配置成基于语义分析来计算对齐的节点序列之间的相似度。
9.一种针对作者消歧的信息处理方法,包括:
基于从文献库中提取的实体及其属性来构建知识图谱,所述实体包括作者实体及其相关联的实体;
遍历所构建的知识图谱,以获得有关作者的节点序列;
针对所述节点序列,基于所述属性进行节点对齐;以及
计算对齐的节点序列之间的相似度,其中,根据所计算的相似度进行所述作者消歧。
10.一种机器可读存储介质,其上携带有程序产品,所述程序产品包括存储在其中的机器可读指令代码,其中,所述指令代码当由计算机读取和执行时,能够使所述计算机执行根据权利要求9所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910384663.0/1.html,转载请声明来源钻瓜专利网。