[发明专利]基于隐私保护的基因相似度计算方法及基因信息获取方法有效
申请号: | 202010312340.3 | 申请日: | 2020-04-20 |
公开(公告)号: | CN111540409B | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 汪洁;张由甲 | 申请(专利权)人: | 中南大学 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B50/40;G16H50/70 |
代理公司: | 长沙永星专利商标事务所(普通合伙) 43001 | 代理人: | 周咏;米中业 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 隐私 保护 基因 相似 计算方法 信息 获取 方法 | ||
本发明公开了一种基于隐私保护的基因相似度计算方法,包括数据库端和用户端分别进行初始化;用户端和数据库端对各自的基因序列进行字符填充;用户端得到用户基因移动序列;数据库端得到存储基因移动序列;用户端得到用户基因移动序列向量;数据库端得到存储基因移动序列向量;用户端对用户基因移动序列向量加密并发送数据库端;数据库端解密并计算存储基因移动序列向量与存储基因移动序列向量之间的序列相似度并得到最终的基因相似度计算结果。本发明还公开了包括所述基于隐私保护的基因相似度计算方法的基因信息获取方法。本发明实现了对用户基因序列与数据库中基因序列的相似度计算、比对和保密传输,而且可靠性高、实用性、保密性和准确性好。
技术领域
本发明属于生物信息技术领域,具体涉及一种基于隐私保护的基因相似度计算方法及基因信息获取方法。
背景技术
人类的全部生物信息可以由基因数据反映出来,并存储在人类的脱氧核糖核酸(deoxyribonucleic acid,简称DNA)序列之中。生物的遗传和变异都与DNA密切相关。如今基因测序技术飞速发展,基因测序的成本正在逐渐降低;基因数据在很多领域有着广泛的应用。
在医学上,为了给病人提供最佳的治疗方案,医生需要将病人的DNA与远程基因组数据库进行比对。数据库中存储个体基因组序列,每个序列都标有此人的医疗状况(Medical Conditions)。医生需要在数据库中找到与病人基因组序列最相似的少数个体,并了解这些个体的医疗状况。这种在数据库中的查询称为相似病人查询(Similar PatientQueries,简称SPQ)。SPQ有利于确定疾病背后的基因突变,也有利于避免无法治愈疾病的痛苦治疗方案,提供更准确的疾病预测和指导。
人类有99.9%以上的DNA是相同的,剩下部分由于遗传变异而不同。最常见的变异只涉及单个核苷酸,这种变异称为单核苷酸多态性(single nucleotide polymorphism,简称SNP)。在基因组序列中只需30~80个独立的SNP位点就可以唯一重识别个体,并含有该个体的隐私敏感信息,例如,载脂蛋白E(apolipoprotein E)基因的两个SNP(rs429358和rs7412)会增加患阿尔茨海默病(Alzheimer’s disease)的风险。
现阶段,信息技术快速发展,医生能够较为轻松的将病人的基因组数据与远程数据库中的若干个体基因组数据进行比对,从而获取相应的相似基因组的相关数据。但是,随着信息技术的发展,病人基因组数据的发送和接收,以及数据库中基因组数据的传输等过程,极易受到攻击,从而导致数据的泄露,紧接着可能会造成严重的隐私泄露,并给社会带来重要的影响。
为了安全地使用数据库中的人类基因数据,需要隐私保护技术保证基因数据的隐私性。目前主要有三种保护基因隐私的思路:基于加密算法的方法、基于差分隐私的方法和基于安全计算协议的方法。
为了解决微生物测序的隐私问题,Wagner等人使用安全计算实现宏基因组分析。Baldi等人提出的PSI协议和Brudno等人提出的PSIS协议是基于海明距离(hammingdistance)近似计算基因数据的相似性。虽然保护了基因数据的隐私性,但只能处理较短的基因组片段。Wang等人通过基因编辑距离(edit distance)近似算法和Private SetDifference Size协议提出了隐私编辑距离协议。但在一些情况下的计算结果并不理想,因为序列的字符排列方式会影响到单字符编辑操作(single-character edits)集合的计算结果,使得相似度计算的偏差,从而导致相似病人查询结果不准确。
发明内容
本发明的目的之一在于提供一种可靠性高、实用性好、保密性好且准确性好的基于隐私保护的基因相似度计算方法。
本发明的目的之二在于提供一种包括了所述基于隐私保护的基因相似度计算方法的基因信息获取方法。
本发明提供的这种基于隐私保护的基因相似度计算方法,包括如下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010312340.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:支付异常处理方法及系统
- 下一篇:一种离子化装置及其应用