[发明专利]用于DNA数据存储的编解码方法和编解码装置有效
申请号: | 202011343923.9 | 申请日: | 2020-11-25 |
公开(公告)号: | CN112382340B | 公开(公告)日: | 2022-11-15 |
发明(设计)人: | 黄小罗;戴俊彪 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B40/00;G16B50/50 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 黄志云 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 dna 数据 存储 解码 方法 装置 | ||
本申请涉及生物信息技术领域,提供一种用于DNA数据存储的二进制信息到碱基序列的编解码方法和处理装置。所述用于DNA数据存储的二进制信息到碱基序列的编解码方法,包括:利用基准碱基组代表基准二进制单元,构建基准碱基组‑基准二进制单元的映射编码规则库;获取待编码的二进制数据,所述二进制数据包括多个二进制单元;采用N个不同的映射编码规则对所述多个二进制单元进行编码,得到与所述二进制数据对应的碱基序列。本申请提供的用于DNA数据存储的二进制信息到碱基序列的编解码方法,可以选择性地预防单碱基重复和碱基序列中GC不均一的问题,从而提高碱基序列可合成性和测序便利性;而且为数据的加密和安全存储提供了更多的可能。
技术领域
本申请涉及数据存储技术领域,尤其涉及一种用于DNA数据存储的二进制信息到碱基序列的编解码方法和编解码装置。
背景技术
互联网以及大数据等领域的快速发展,促使当今社会的信息呈现出爆发性的增长。传统的存储介质,包括硬盘、磁带、光盘等由于存储寿命短,维护成本高,存储密度低,远远无法满足未来大规模数据存储的需求。脱氧核糖核酸(DeoxyriboNucleic Acid, DNA)作为一种近年来发展起来的信息存储介质,具有存储密度高,存储时间长,维护成本低等优势,被认为是未来信息存储最有潜力的介质之一。
DNA分子具有四种碱基,它们分别是:腺嘌呤 (Adenine,A)、胞嘧啶 (Cytosine,C)、鸟嘌呤 (Guanine,G)和胸腺嘧啶 (Thymine,T)。基于DNA的数据存储技术是利用上述四种碱基序列即A/C/G/T来表示二进制“0”和“1”组成的数据序列,这个过程被称为编码。而将碱基序列转换成二进制数据的过程,则称为解码。当二进制数据转换成碱基序列之后,通过DNA合成技术生成单链的DNA分子结构保存。生成的单链DNA分子可以通过DNA测序技术,检测出单链DNA分子中的四种碱基组成的碱基序列,并通过解码机制得出最终的二进制数据流。
目前,已有的编码方法单一,可选择的编码规则少的问题,进一步造成得到的碱基序列中GC不均一,单碱基重复等,影响碱基序列合成及测序的问题。
发明内容
本申请实施例提供了一种用于DNA数据存储的二进制信息到碱基序列的编解码方法和编解码装置,旨在解决现有的二进制数据处理方法单一,可选择的编码规则少,导致得到的碱基序列中GC不均一,单碱基重复,从而影响碱基序列合成及测序的问题。
第一方面,本申请提供一种用于DNA数据存储的二进制信息到碱基序列的编解码方法,方法包括:
利用基准碱基组代表基准二进制单元,构建基于基准碱基组-基准二进制单元的映射编码规则库,其中,基准碱基组的碱基数为M,二进制单元的比特数为2M,且M为大于或等于2的整数;
获取待编码的二进制数据,二进制数据包括多个二进制单元;
采用N个不同的映射编码规则对多个二进制单元进行编码,得到与二进制数据对应的碱基序列,其中,N为大于或等于2的整数,碱基序列用于合成存储有与二进制数据对应的数据信息的DNA;N个不同的映射编码规则选自基准碱基组-基准二进制单元的映射编码规则库中的规则。
在一些实施例中,多个二进制单元中相隔N-1个二进制单元的两个二进制单元采用N个不同的映射编码规则中的同一个映射编码规则进行编码。
在一些实施例中,N=2,N个不同的映射编码规则包括第一映射编码规则和第二映射编码规则;采用N个不同的映射编码规则对多个二进制单元进行编码,得到与二进制数据对应的碱基序列,包括:
采用第一映射编码规则对二进制数据中位于奇数排位的二进制单元进行编码,采用第二映射编码规则对二进制数据中位于偶数排位的二进制单元进行编码,得到与二进制数据对应的碱基序列。
在一些实施例中,N个不同的映射编码规则中包含的同一种基准碱基组对应N个不同的基准二进制单元。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011343923.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:病死动物尸体储存冷库
- 下一篇:一种高抗拉强度的铜合金铸造工艺
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置