[发明专利]确定文档之间的相似度的方法和设备有效
申请号: | 201110103501.9 | 申请日: | 2011-04-25 |
公开(公告)号: | CN102236693A | 公开(公告)日: | 2011-11-09 |
发明(设计)人: | 三品拓也;吉滨佐知子 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市中咨律师事务所 11247 | 代理人: | 于静;杨晓光 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种确定文档之间的相似度的方法和设备。本发明的目标是提供一种检测其中混合了文本信息和非文本信息的文档之间的相似度的技术。为了实现上述目标,作为第一方面,提供了一种支持确定两个文档数据段之间的相似度的计算机可执行的方法。所述文档数据段包括对象,所述对象包括文本、非文本或文本与非文本的组合。所述方法包括以下步骤:将所述文档数据段中的每个文档数据段转换为有向图并存储所述有向图;以及通过计算机的操作,使用每个对象的重要度计算转换后的有向图之间的相似度。 | ||
搜索关键词: | 确定 文档 之间 相似 方法 设备 | ||
【主权项】:
一种支持确定两个文档数据段之间的相似度的计算机可执行的方法,所述文档数据段包括对象,所述对象包括文本、非文本或文本与非文本的组合,所述方法包括以下步骤:将所述文档数据段中的每个文档数据段转换为有向图并存储所述有向图;以及使用每个对象的重要度计算转换后的有向图之间的相似度。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110103501.9/,转载请声明来源钻瓜专利网。