[发明专利]面向DNA存储的DNA序列处理方法、装置与电子设备有效
申请号: | 202110994772.1 | 申请日: | 2021-08-27 |
公开(公告)号: | CN113611364B | 公开(公告)日: | 2022-04-08 |
发明(设计)人: | 李昊;陈永强;陈河兵;黄昕;郑炀;伯晓晨 | 申请(专利权)人: | 中国人民解放军军事科学院军事医学研究院 |
主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B40/00;G06F11/10 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 何少岩 |
地址: | 100082 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 dna 存储 序列 处理 方法 装置 电子设备 | ||
本发明提供了一种面向DNA存储的DNA序列处理方法、装置与电子设备,涉及DNA信息存储的技术领域,包括获取目标DNA序列的多个目标子序列;对每个第一中间子序列进行数据偏移处理,得到多个第二中间子序列;将多个第二中间子序列确定为目标DNA序列的处理后的多个子序列。长序列分为多个子序列后,经过编码和带误码采样,各子序列由于码字种类较少,容易出现不同子序列距离接近情况,如此将给聚类结果造成干扰导致正确率下降。本申请的技术方案通过两步加扰方案,增加了子序列之间的距离,提高了聚类正确率,进而提高了还原DNA序列的正确率。
技术领域
本发明涉及DNA信息存储的技术领域,尤其是涉及一种面向DNA存储的DNA序列处理方法、装置与电子设备。
背景技术
数字时代以来,信息量急速膨胀,普通的磁性存储介质已经无法满足数据的存储需求。随着分子遗传学和基因组学的发展,脱氧核糖核苷酸(DNA)这种生物遗传信息的存储物质逐渐进入人们的视野。DNA存储具有存储信息量大、信息体积比很小、信息拷贝成本低、信息存储时间长、存储成本低等优势,非常适合特大数据的长时间存储。
相关技术中,由于原始DNA序列经过了拆分、编码和带误码采样等复杂处理过程,再加上各子序列码字种类较少,所以编译后的DNA子序列之间的欧氏距离容易特别接近,甚至多个子序列中所包含的码字可能会混合在一起,导致解码时无法准确解读各个子序列中的编码,进而导致还原原始序列的正确率下降。
发明内容
本发明的目的在于提供一种面向DNA存储的DNA序列处理方法、装置与电子设备,以增大DNA子序列之间的欧氏距离,进而提高还原DNA序列的正确率。
第一方面,本发明实施例提供一种面向DNA存储的DNA序列处理方法,该方法包括:获取目标DNA序列的多个目标子序列;其中,目标DNA序列中的信息包含在多个目标子序列中;对每个目标子序列进行加扰处理,得到多个第一中间子序列;对每个第一中间子序列进行数据偏移处理,得到多个第二中间子序列;将多个第二中间子序列确定为目标DNA序列的处理后的多个子序列。
在可选的实施方式中,上述对每个目标子序列进行加扰处理,得到多个第一中间子序列的步骤,包括:利用预设的扰码多项式对每个目标子序列进行加扰处理,得到多个第一中间子序列。
在可选的实施方式中,上述对每个第一中间子序列进行数据偏移处理,得到多个第二中间子序列的步骤,包括:基于预设的距离参数,对每个第一中间子序列进行数据偏移处理,得到多个第二中间子序列。
在可选的实施方式中,上述获取目标DNA序列的多个目标子序列的步骤,包括:将目标DNA序列进行拆分处理,得到多个原始子序列;针对每个原始子序列,执行下述操作:将原始子序列的地址编码写入原始子序列中的指定位置,得到第三中间子序列;将原始子序列的地址编码的冗余校验码加入第三中间子序列的指定位置,得到第四中间子序列;对第四中间子序列进行RS编码,得到目标子序列。
在可选的实施方式中,上述对第四中间子序列进行RS编码,得到目标子序列的步骤,包括:当第四中间子序列中存在相同的码字,且相同的码字满足预设条件时,对第四中间子序列进行加密处理,得到第五中间子序列;对第五中间子序列进行RS编码,得到目标子序列。
在可选的实施方式中,上述将多个第二中间子序列确定为目标DNA序列的处理后的多个子序列的步骤之后,上述方法还包括:针对每个第二中间子序列,执行下述操作:对第二中间子序列进行指定次数的加躁采样,得到采样结果;对采样结果进行聚类匹配,得到第六中间子序列;利用扰码多项式对第六中间子序列进行解码,得到第七中间子序列;其中,第七中间子序列包含有解码后的地址编码、解码后的冗余校验码和解码后的RS纠错码;利用CRC校验,判断第七中间子序列中的解码后的冗余校验码的是否正确;如果错误,剔除第七中间子序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军军事科学院军事医学研究院,未经中国人民解放军军事科学院军事医学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110994772.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种利用大棚提高茄子杂交制种质量的方法
- 下一篇:一种船舶用游泳池系统