[发明专利]一种安全近似模式匹配方法及系统在审
| 申请号: | 202111087088.1 | 申请日: | 2021-09-16 |
| 公开(公告)号: | CN113901510A | 公开(公告)日: | 2022-01-07 |
| 发明(设计)人: | 魏晓超;丁爽;徐琳 | 申请(专利权)人: | 山东师范大学 |
| 主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F21/60;G16B50/00 |
| 代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 李琳 |
| 地址: | 250014 山*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 安全 近似 模式 匹配 方法 系统 | ||
本发明公开了一种安全近似模式匹配方法及系统,首先密钥生成方生成公开秘钥和解密秘钥,并将公开秘钥传输至文本持有方和模式持有方;然后文本持有方基于公开秘钥和持有的文本得到加密文本,模式持有方基于公开秘钥和持有的模式得到加密模式;两个第三方对加密文本和加密模式进行同态操作,对加密模式中的每个子模式与加密文本进行匹配,并将匹配结果发送至密钥生成方;最后密钥生成方使用所述解密秘钥对匹配结果进行解密并乘以随机数后,发送至模式持有方,持有模式信息的参与方能够获得其模式在文本中出现的位置,但持有文本的参与方不会得到任何关于模式的相关信息,有效避免了隐私的泄露。
技术领域
本发明涉及近似模式匹配技术领域,特别是涉及一种安全近似模式匹配方法及系统。
背景技术
本部分的陈述仅仅是提到了与本发明相关的背景技术,并不必然构成现有技术。
近似模式匹配技术应用十分广泛,如在人类基因匹配系统中,医院持有的不同患者的基因序列可能存在错误和遗漏,所以采用通配符替换模式中的错误序列,来实现包含重复通配符和复合通配符的模式匹配。国家基因库中的基因序列与患者的基因序列匹配,并从中筛选相似的基因序列,筛选出的基因序列匹配度越高,对患者的病情的诊断越精确,效率越高。
然而,国家基因库持有的人类基因序列与医院持有的患者基因序列属于隐私数据,双方都不希望公开自己的数据,以避免泄露自己的隐私。当进行模式匹配的实体具有隐私保护需求时,传统的模式匹配方式将无法满足。
发明内容
为了解决现有技术的不足,本发明提供了一种安全近似模式匹配方法及系统,持有模式信息的参与方能够获得其模式在文本中出现的位置,但持有文本的参与方不会得到任何关于模式的相关信息,有效避免了隐私的泄露。
第一方面,本发明提供了一种安全近似模式匹配方法;
一种安全近似模式匹配方法,包括如下步骤:
密钥生成方生成公开秘钥和解密秘钥,并将公开秘钥传输至文本持有方和模式持有方;
文本持有方基于公开秘钥和持有的文本,得到加密文本;
模式持有方基于公开秘钥和持有的模式,得到加密模式;
两个第三方对加密文本和加密模式进行同态操作,对加密模式中的每个子模式与加密文本进行匹配,并将匹配结果发送至密钥生成方;
密钥生成方使用所述解密秘钥对匹配结果进行解密并乘以随机数后,发送至模式持有方。
进一步的,所述得到加密文本的具体步骤为:
使用多项式打包方法将持有的文本打包为多项式;
将所述多项式的系数使用公开秘钥加密成加密文本。
进一步的,所述得到加密模式的具体步骤为:
以重复通配符为拆分点对持有的模式进行拆分,得到子模式;
使用多项式打包方法将所有子模式打包为多项式;
将所述多项式的系数使用公开秘钥加密成加密模式。
进一步的,所述子模式为不含通配符的子模式或只含复合通配符的子模式。
进一步的,所述进行匹配的具体步骤为:
如果子模式为所述不含通配符的子模式,直接采用平方欧式距离对每个子模式与加密文本进行匹配;
如果子模式为所述只含复合通配符的子模式,使用双查询方法对每个子模式与加密文本进行匹配。
进一步的,所述双查询方法具体为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东师范大学,未经山东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111087088.1/2.html,转载请声明来源钻瓜专利网。





