[发明专利]一种基于潜层语义分析的安全的文档相似性计算方法和系统在审
申请号: | 201810113977.2 | 申请日: | 2018-02-05 |
公开(公告)号: | CN108519983A | 公开(公告)日: | 2018-09-11 |
发明(设计)人: | 陈小军;于晓杰;时金桥;申立艳;王大魁;胡兰兰 | 申请(专利权)人: | 中国科学院信息工程研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 北京君尚知识产权代理事务所(普通合伙) 11200 | 代理人: | 邱晓锋 |
地址: | 100093 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于潜层语义分析的安全的文档相似性计算方法和系统。该方法在不泄露敏感词项的前提下,需进行文档相似性计算的双方借助私有的集合交集计算协议进行全局向量空间的约定;然后双方基于潜层语义分析模型和同态加密技术,进行基于向量的安全的文档相似性计算。本发明在约定全局向量空间时,可以保证不暴露一方的敏感词项给另一方;在使用同态加密技术在两方之间进行基于潜层语义分析的文档相似性计算时,不会泄露各自的文档向量。本发明在保证计算的安全性同时,能够提高文档相似计算的准确率与效率。 | ||
搜索关键词: | 文档相似性 语义分析 全局向量 敏感词 泄露 语义分析模型 交集 加密技术 同态加密 文档向量 安全 准确率 文档 向量 集合 保证 暴露 | ||
【主权项】:
1.一种基于潜层语义分析的安全的文档相似性计算方法,其特征在于,包括以下步骤:1)在不泄露敏感词项的前提下,需进行文档相似性计算的双方借助私有的集合交集计算协议进行全局向量空间的约定;2)所述双方基于潜层语义分析模型和同态加密技术,进行基于向量的安全的文档相似性计算。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810113977.2/,转载请声明来源钻瓜专利网。