[发明专利]一种基于内容的电子文档管理方法及装置有效
申请号: | 201610957633.0 | 申请日: | 2016-10-27 |
公开(公告)号: | CN107085583B | 公开(公告)日: | 2021-05-28 |
发明(设计)人: | 熊文;丁紫惠 | 申请(专利权)人: | 中国长城科技集团股份有限公司 |
主分类号: | G06F16/93 | 分类号: | G06F16/93 |
代理公司: | 深圳中一专利商标事务所 44237 | 代理人: | 张全文 |
地址: | 518000 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 内容 电子 文档 管理 方法 装置 | ||
1.一种基于内容的电子文档管理方法,其特征在于,所述方法包括:
接收输入的电子文档定位请求,根据所述电子文档定位请求获取定位条件,所述定位条件包括:属性信息和/或定位关键词集;
若所述定位条件为属性信息,则在托管目录中检索与所述属性信息匹配的电子文档,将检索到的与所述属性信息匹配的电子文档作为文档定位结果,所述托管目录为受计算设备保护且用户无法直接点击访问的目录,计算设备中所有的电子文档均可存放于所述托管目录下;
若所述定位条件为定位关键词集,则获取所述定位关键词集包含的各个关键词的经验权重,根据带权重的内积算法,计算所述定位关键词集与目录索引表中记录的各个电子文档的关键词集之间的第一相似度,若存在第一目标关键词集,则将与所述第一目标关键词集关联的电子文档所在的目录确定为可定位目录,将所述可定位目录下的电子文档作为文档定位结果,其中,所述第一目标关键词集为与所述定位关键词集的第一相似度不小于预设的第一相似度阈值的电子文档的关键词集,所述目录索引表为根据托管目录实时更新的,记录有托管目录中每个电子文档所在目录的信息、文档关键词集的索引表,其中所述目录索引表记录的文档关键词集为电子文档的最多前N个最大权重的关键词组成的关键词集,N为预设的大于或等于2的自然数,所述目录索引表预先存储于计算设备的数据库中;
若所述定位条件为属性信息和定位关键词集,则分别计算所述定位关键词集和目录索引表中记录的各个电子文档的关键词集之间的第一相似度,若存在所述第一目标关键词集,则将与所述第一目标关键词集关联的电子文档所在的目录确定为可定位目录,在可定位目录中检索与所述属性信息匹配的电子文档,将检索到的与所述属性信息匹配的电子文档作为文档定位结果;
输出符合所述定位条件的文档定位结果;
所述根据带权重的内积算法,计算所述定位关键词集与目录索引表中记录的各个电子文档的关键词集之间的第一相似度,包括:
将所述定位关键词集作为向量x,以及将所述目录索引表中的任一个电子文档的关键词集作为向量y;
判断在向量x与向量y中是否存在相同的关键词;
若向量x与向量y中存在相同的关键词,则累加所有相同的关键词的经验权重的点积,得到累加结果;
将所述累加结果除以向量x与向量y的长度积的平方根,得到所述定位关键词集与所述任一个电子文档的关键词集的所述第一相似度;
在所述获取所述定位关键词集包含的各个关键词的经验权重之后,所述根据带权重的内积算法,计算所述定位关键词集与目录索引表中记录的各个电子文档的关键词集之间的第一相似度之前,还包括:
将所述定位关键词集与所述目录索引表中记录的各个电子文档的最大权重的关键词作相似度计算,筛选出所述相似度计算结果大于预设的第一相似度阈值的电子文档。
2.如权利要求1所述的方法,其特征在于,所述数据库还包括:关键词索引表;所述将所述可定位目录下的电子文档作为文档定位结果,包括:
在关键词索引表中查找出处于所述可定位目录下的各个电子文档的关键词集;
计算所述定位关键词集与所述可定位目录下的各个电子文档的关键词集的第二相似度;
若存在第二目标关键词集,则将与所述第二目标关键词集关联的电子文档确定为文档定位结果,其中,所述第二目标关键词集为与所述定位关键词集的第二相似度不小于预设的第二相似度阈值的电子文档的关键词集。
3.如权利要求1所述的方法,其特征在于,所述输出符合所述定位条件的文档定位结果,包括:
当所述文档定位结果中的电子文档新增加了预设数量个时,输出所述文档定位结果中新增加的各个电子文档的文档名称。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国长城科技集团股份有限公司,未经中国长城科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610957633.0/1.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法