[发明专利]基于基因序列与基因功能的非数值字段的加密及解密方法有效

专利信息
申请号: 201910850865.X 申请日: 2019-09-10
公开(公告)号: CN110718272B 公开(公告)日: 2020-11-17
发明(设计)人: 张毅骏;谭翔 申请(专利权)人: 上海派拉软件股份有限公司
主分类号: G16B50/40 分类号: G16B50/40;G06F21/60
代理公司: 南京九致知识产权代理事务所(普通合伙) 32307 代理人: 严巧巧
地址: 200120 上海市浦东新区中国(上*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供了一种基于基因序列与基因功能的非数值字段的加密及解密方法,其特征在于,包括以下步骤:建立马尔科夫‑蒙特卡罗模型;对于数据库中每一个非数值字段,获得基因功能及基因序列训练马尔科夫‑蒙特卡罗模型;利用训练后的马尔科夫‑蒙特卡罗模型进行解密操作。
搜索关键词: 基于 基因 序列 功能 数值 字段 加密 解密 方法
【主权项】:
1.一种基于基因序列与基因功能的非数值字段的加密及解密方法,其特征在于,包括以下步骤:/n步骤1、建立马儿科夫-蒙托卡罗模型;/n步骤2、对于数据库中每一个非数值字段,取出非数值字段中所有不同的明文,对每一种不同的明文进行加密生成基因功能,每个基因功能生成Y个不同的密文,每个密文即一个基因序列;/n步骤3、对每个基因序列,计算每个基因序列的长度len(seq(x)),seq(x)表示基因序列x,从基因序列数据集中筛选出长度为len(seq(x))的所有基因序列组成用于训练的基因序列集合,将基因序列集合输入步骤1建立的马儿科夫-蒙托卡罗模型,由马儿科夫-蒙托卡罗模型从基因序列的第一位至最后一位计算每个位置给定字母后,所有可能字母的条件概率分布,从而完成马儿科夫-蒙托卡罗模型的训练;/n步骤4、获取待加密的非数值字段中的所有不同的明文,对每一种不同的明文进行加密生成基因功能,每一个基因功能生成Y个不同的密文,每个密文即一个基因序列,所有基因序列组成基因序列集;/n步骤5、解密时,获得待比对的基因序列,计算待比对的基因序列的长度,从基因序列集中选出与该长度一样的所有基因序列组成基因序列子集;/n步骤6、将基因序列子集与待比对的基因序列输入训练好的马儿科夫-蒙托卡罗模型进行比对,利用条件概率下的极大似然估计,从基因序列子集中匹配出k个相似度最高的基因序列,构成新的基因序列数据子集;/n步骤7、根据上一步获得的新的基因序列数据子集,返回基因序列数据子集中所有基因序列所对应的基因功能,计算基因功能中占比最大的基因功能的占比,若该占比大于等于p,则该基因功能即为待比对的基因序列所对应的基因功能,否则返回步骤5。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海派拉软件股份有限公司,未经上海派拉软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910850865.X/,转载请声明来源钻瓜专利网。

同类专利
  • 编码/解码方法、装置和数据处理装置-201780094012.7
  • 杨焕明;刘斯奇;汪建 - 深圳华大生命科学研究院
  • 2017-08-25 - 2023-07-21 - G16B50/40
  • 一种编码/解码方法、装置和数据处理装置,涉及数据处理技术领域。该编码方法包括:对信息进行数字化处理生成序列数据(110);将序列数据划分为N个数据片段(120),N为大于1的整数;针对每个数据片段,在基因数据库中查找相应的核酸片段,并将核酸片段在基因数据库中的位置信息作为每个数据片段的标识(130);根据各个数据片段对应的标识生成序列编码(140)。该方法和装置能够提高加密效率和安全性。
  • 基于隐私保护和TEE的多方医疗隐私数据安全共享方法-202310404161.6
  • 郑灏;王爽;孙琪;王帅;李帜 - 杭州锘崴信息科技有限公司
  • 2023-04-10 - 2023-07-14 - G16B50/40
  • 本申请提供一种基于隐私保护和TEE的多方医疗隐私数据安全共享方法。包括:获取多个参与方的本地计算结果;等位基因的分布频率包括SNP上第一位点出现第一基因的第一频率、第二位点出现第二基因的第二频率、以及出现第一基因组的第三频率、第二基因组的第四频率;各参与方的本地计算结果进行组合,得到各参与方的待分析坐标位点;待分析坐标位点进行聚类,得到第一坐标位点的第一中心点和第二坐标位点的第二中心点,确定出现第一基因、第二基因和同时出现第一基因和第二基因的真实频率;依据真实频率进行关联度计算,确定SNP上第一位点和第二位点上的基因之间的基因关联关系。本申请对SNP位点之间的基因关联关系进行确定,便于对基因的研究。
  • 基于安全多方计算的敏感数据安全关联分析方法及装置-202310233380.2
  • 张昊天;童画;戴永林;喻昕昕 - 广州芳禾数据有限公司
  • 2023-03-10 - 2023-07-11 - G16B50/40
  • 本发明公开了一种基于安全多方计算的敏感数据安全关联分析方法及装置,所述方法包括:在获取由多个参与方的基因组数据组成的待处理数据集后,将多个基因组数据秘密共享给预设的安全三方计算框架包含的三个计算方;控制每个所述计算方对分配得到的基因组数据依次进行过滤处理和主成分提取处理得到主成分数据;调用三个所述计算方采用所述主成分数据进行安全关联分析。本发明可以将数据秘密共享给安全三方计算框架的计算方进行计算处理,即使任意一方被攻击,也能调用剩余两方对数据进行计算,在保护数据安全的基础上避免处理中断的情况,以确保计算精度和稳定性。
  • 一种基于探针发卡结构的DNA杂交信息存储加密方法-202310372450.2
  • 王晓霞;张翼飞;王海华;张东裔;刘翟;孙远东;陈芝兰;崔小娟 - 湖南科技大学
  • 2023-04-09 - 2023-07-04 - G16B50/40
  • 一种基于探针发卡结构的DNA杂交信息存储加密方法,包括一套带荧光基团、淬灭基团、两个限制性内切酶识别位点的DNA寡核苷酸发卡结构探针组合和两套限制性内切酶组合;为了增强淬灭基团的淬灭效果,本发明采用发卡结构的探针基本序列,在特定的限制性内切酶将带淬灭基团的发卡结构切除,探针激活,由于发卡结构的发卡结构会使就近的淬灭基团对荧光基团进行作用,在DNA杂交存储信息读取的DNA杂交过程中,如果两基团相距较远淬灭效果严重不足,荧光检测信号存在偏差,而导致读取信息正确率下降。本发明实现了DNA杂交信息存储技术的硬加密,能保障加密程度的准确性,提升DNA杂交存储信息的可靠性,保证该技术在各行业发挥作用时的安全性。
  • 信使核糖核酸密码子序列的处理方法、装置及电子设备-202310202151.4
  • 贺选;王德品 - 南京燧坤智能科技有限公司
  • 2023-03-03 - 2023-06-09 - G16B50/40
  • 本发明公开了一种信使核糖核酸密码子序列的处理方法、装置及电子设备。其中,该方法包括:对多个初始密码子序列进行分类处理,得到第一序列集和第二序列集,其中,多个初始密码子序列对应于不同的信使核糖核酸;采用第一序列集,第二序列集,多个初始密码子序列对应的氨基酸序列,对预先构建的循环生成对抗网络模型进行训练,基于训练后的循环生成对抗网络模型,将第二序列集中的初始密码子序列转换为具备第一序列特征的目标密码子序列。本发明解决了相关技术中主要采用人工收集序列特征,并采用回归预测模型进行信使核糖核酸密码子序列优化的方法,存在的特征收集不全面,回归模型拟合能力有限,序列优化效果差的技术问题。
  • 高效构建生物多肽活性分子数据库的方法、设备及系统-202210456641.2
  • 陈家悦;贾柯 - 杭州拾光欣雅生物技术有限公司
  • 2022-04-28 - 2023-05-19 - G16B50/40
  • 本申请涉及一种高效构建生物多肽活性分子数据库的方法、设备及系统,方法包括:获取碱基序列,基于预设流程根据碱基序列构建多肽活性分子数据库。由于本申请中预设流程的各流水线步骤并行执行,相较于现有技术,鉴定和翻译效率得到极大提高。本申请中的流水线并行步骤包括:对碱基序列进行格式转化得到数字化碱基序列;将数字化碱基序列进行拆分得到多个数字化碱基组并存储,还按序依次为每个数字化碱基组赋予存储地址;将构成终止组的相邻两个数字化碱基组之间的碱基序列进行翻译得到氨基酸序列。将氨基酸序列和其对应的存储地址进行输出,构建生物多肽活性分子数据库。
  • 基于氨基酸序列的密码子优化在mRNA疫苗研发中的应用-202211265184.5
  • 钱朝晖;陆剑;昝富文;吴鑫凯;单科家 - 中国医学科学院病原生物学研究所;北京大学
  • 2022-10-17 - 2023-05-05 - G16B50/40
  • 本发明公开了基于氨基酸序列的密码子优化在mRNA疫苗研发中的应用。基于目标抗原蛋白的氨基酸序列,对其CDS在密码子适应指数(CAI)水平上进行优化得到HighestCAI序列,在最小折叠自由能(MFE)水平上进行优化得到LowestMFE序列,再以HighestCAI序列作为祖先序列进行MFE的定向优化,在某一个或某几个世代分别取MFE值最低的序列作为兼顾翻译效率和mRNA稳定性的优化序列,最终将这些序列通过细胞水平的蛋白表达验证,获得稳定高表达的CDS序列应用于mRNA疫苗的设计。本发明采用不同方式的密码子优化策略以提高mRNA疫苗转导机体后产生有效抗原量,为进一步优化疫苗生产提供了指导。
  • 一种基于基因杂交和基因突变的图像DNA加密存储方法-202211152420.2
  • 刘文斌;姚翔宇;谢然则;昝乡镇;苏燕青;许鹏 - 广州大学
  • 2022-09-21 - 2023-01-31 - G16B50/40
  • 本发明公开了一种基于基因杂交和基因突变的图像DNA加密存储方法,技术方案基于基因杂交以及基因突变机制对图像数据进行DNA加密存储。考虑到DNA存储系统的易出错的特性,在基因突变这一加密步骤设计中,用于加密像素的基因序列满足GC含量50%左右,均聚物长度不超过2及相互之间汉明距离大于3等限制条件。同时基因杂交及基因突变具有多变性及混淆性,本方法能够抵抗常见的密码学攻击手段。在易发生错误的DNA存储系统中,密文DNA序列表现出较强的鲁棒性,即便存在较高碱基替换率及序列丢失率时,仍可成功解密。该加密方法实现简单,可以应用在任何DNA存储系统并解决其数据安全问题。
  • 一种数据存储、还原方法及装置-201910132713.6
  • 郝建业;齐浩;张程伟;侯韩旭 - 天津大学
  • 2019-02-22 - 2023-01-20 - G16B50/40
  • 本申请提供一种数据存储、还原方法及装置,该方法通过确定待存储文件被分割成的至少一组数据中的一组目标数据;计算生成矩阵与目标数据的乘积,得到生成矩阵中每条数据的第一目标子数据;若生成矩阵中数据的第一目标子数据不满足基因编码约束条件,更新生成矩阵中的数据,直至生成的第一目标子数据满足基因编码约束条件;基于生成矩阵中各条数据的第一目标子数据,生成目标数据的DNA数据的方式,将待存储文件转换成用于以DNA为数据存储介质进行数据存储的DNA数据,以便于达到以DNA为数据存储介质,实现数据存储的目的。
  • 基于可信执行环境的医疗隐私数据安全分析方法及装置-202211058546.3
  • 王海宁;孙琪;王爽;郑灏;王帅;李帜 - 杭州锘崴信息科技有限公司
  • 2022-08-31 - 2022-12-09 - G16B50/40
  • 本申请提供一种基于可信执行环境的医疗隐私数据安全分析方法及装置,涉及数据安全领域,该方法包括:在可信执行环境中,确定数据提供方提供的样本序列中的目标位点处所包含的信息,根据该信息,生成样本序列的编码数据集,编码数据集中包括有样本序列中每个目标位点对应的编码结果,获取数据查询方提供至可信执行环境中的查询数据集,其中包括数据查询方提供的查询序列中每个目标位点对应的编码结果,通过隐私计算和同态加密技术,将编码数据集和查询数据集中相同目标位点对应的编码结果进行对比,计算得到对比结果,并基于对比结果分析确定样本序列与查询序列的来源是否存在关联。该方案可以保障数据安全,避免数据查询时出现隐私数据泄露。
  • 一种基于编码链发卡结构添加与移除的DNA杂交信息存储加密方法-202110809958.5
  • 肖祖颖;王海华;张翼飞;张东裔;成鹏飞;刘翟 - 湖南科技大学
  • 2021-07-17 - 2022-07-08 - G16B50/40
  • 本发明公开了一种基于编码链发卡结构特异性移除的DNA存储加密方法,包括一套带发卡结构与限制性内切酶识别位点的DNA编码链和限制性内切酶组合。其中,特定的限制性内切酶可将特定编码链的发卡结构切断,使编码区暴露而将其激活。在信息读取过程中,如果DNA编码链未经正确激活,则因发卡结构阻碍杂交而导致信息无法有效读取。该方法实施时,发送方从编码链组合中选取一组进行数据写入,将存储盘发给接收方,并用另一保密途径将密钥(即正确的内切酶信息)发送。接收方在收到密钥后方能对编码链做正确处理而将其激活,而错误处理将无法激活,甚至可能导致存储盘自毁。本发明实现了DNA杂交存储技术的硬加密,促进该存储技术的应用。
  • 保护隐私安全的基因数据分享方法和装置-202111274064.7
  • 陈智罡;宋新霞 - 浙江万里学院
  • 2021-10-29 - 2022-01-28 - G16B50/40
  • 本发明公开了一种保护隐私安全的基因数据分享方法和装置,可以控制谁可以访问和使用他们的数据。应用于数据提供终端的方法包括:生成一组虚拟个体基因数据,最大化防止攻击者通过观察加密数据与明文数据后进行关联;为数据提供者生成密钥以对原始文件进行加密,获得对称加密文件;为每个虚拟个体和数据提供者分配一个标识,以消除虚拟个体对后面数据查询者的数据分析统计的影响;使用集体公钥分别对原始文件、虚拟个体基因数据、密钥、标识进行加密并发送至计算节点;设置访问策略和接收并回复数据访问通知。本发明整合了包括同态加密、数据所有者基于加密的访问控制和区块链技术在内的多种技术并互补,实现了可控、透明和安全的基因组数据共享。
  • 基于标签数据生长基因的数据序列处理方法-202110581056.0
  • 白杰 - 江苏数字产权交易有限公司
  • 2021-05-27 - 2021-06-25 - G16B50/40
  • 本发明提供了基于标签数据生长基因的数据序列处理方法,包括数据序列中标签数据生长基因的提取方法,该方法使用数据序列S扫描标签数据库,得到一组标签数据段及该数据段在数据序列S中的位置,用所述标签数据段对应的标签及其在数据序列S中的位置作为本次扫描结果参数,记录这些本次扫描结果参数,然后在数据序列S中去除所述标签数据段,用剩余数据段组装成新的数据序列S重新扫描,最后组织每一次扫描结果参数,生成原始数据序列S的生长基因序列。本发明还提供了基于标签数据生长基因的数据存储方法和数据存储方法。
  • 改进的计算设备-201880069786.9
  • 杰里米·德古尚;保罗·艾斯提维斯-瓦里西莫;玛利亚·佛南德斯;马库斯·沃尔普 - 卢森堡大学
  • 2018-09-26 - 2020-11-13 - G16B50/40
  • 基因组信息,例如,DNA、RNA和蛋白质,携带了大量的敏感信息,这些敏感信息的泄露有损害个人和公司的隐私和/或商业利益的风险。本发明公开了一种装置、系统和方法,用于在整个基因组工作流程中,在测序仪生成敏感基因组信息的同时或之后保护所述敏感基因组信息。根据敏感度对原始基因组数据(“读段”)进行检测和分类。通过切除所述读段中敏感度较低或非敏感的部分中的检测到的敏感碱基或碱基对的编号和类型来对所述读段进行分解。在所述基因组工作流程中,较佳在可信执行环境(trusted execution environment,TEE)中在本地或以分布式的方式对被切除的信息进行处理,以提高安全性。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top