[发明专利]用于DNA数据存储的编解码方法和编解码装置有效
申请号: | 202011343923.9 | 申请日: | 2020-11-25 |
公开(公告)号: | CN112382340B | 公开(公告)日: | 2022-11-15 |
发明(设计)人: | 黄小罗;戴俊彪 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B40/00;G16B50/50 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 黄志云 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 dna 数据 存储 解码 方法 装置 | ||
1.一种用于DNA数据存储的二进制信息到碱基序列的编解码方法,其特征在于,所述方法包括:
利用基准碱基组代表基准二进制单元,构建基于基准碱基组-基准二进制单元的映射编码规则库,其中,所述基准碱基组的碱基数为M,所述二进制单元的比特数为2M,且M为大于或等于2的整数,所述编码规则库大于等于20922789888000种;
获取待编码的二进制数据,所述二进制数据包括多个二进制单元;
采用N个不同的映射编码规则对所述多个二进制单元进行编码,得到与所述二进制数据对应的碱基序列,其中,N为大于或等于2的整数,所述碱基序列用于合成存储有与所述二进制数据对应的数据信息的DNA;所述N个不同的映射编码规则选自所述基准碱基组-基准二进制单元的映射编码规则库中的规则;
所述采用N个不同的映射编码规则对所述多个二进制单元进行编码,包括:
按照各个二进制单元的顺序,采用对应编号的映射编码规则进行编码;
或者,对二进制数据中的相邻的两个二进制单元,采用不同的映射编码规则进行编码,具体为:所述多个二进制单元包括p个二进制单元,其中,第一二进制单元采用第一映射编码规则,第二二进制单元采用除第一映射编码规则之外的任意一个映射编码规则,第三二进制单元采用除第二二进制单元采用的映射编码规则之外的任意一个映射编码规则,直到第p二进制单元采用除第p-1二进制单元采用的映射编码规则之外的任意一个映射编码规则;p为大于3的整数;
或者,所述二进制数据包括多条二进制子数据,把多条二进制子数据按照预设的规则混编成一条二进制数据后,再对混编后的二进制数据采用编码规则进行编码,具体为:
2条二进制子数据分别标记为第一二进制子数据和第二二进制子数据,按2bits作为一个单元将第一二进制子数据和第二二进制子数据划分成多个子单元,并对子单元进行排序;将第一二进制子数据和第二二进制子数据中相同排序位的子单元进行合并,将两条二进制子数据整合成第三二进制数据;
按4bits作为一个单元将第三二进制数据划分成多个二进制单元,对二进制单元进行奇数和偶数排序后,采用第一映射编码规则对位于奇数排位的二级制单元进行编码,采用第二映射编码规则对位于偶数排位的二进制单元进行编码,得到碱基序列;其中,对于待转化的二进制数据末尾不足一个二进制单元时,用0或1补齐后再进行编码;
所述方法还包括:
根据DNA合成技术能够合成的长度,将编码得到的碱基序列拆分成J个序列小片段,J为大于且小于200nt的正整数;
碱基子序列设置有索引标记,用于标记碱基子序列在碱基序列中的位置,所述索引标记添加在拆分的小片段左边或者右边;且在拆分的J个序列小片段两端还加上16-25个碱基的接头序列;且在拆分的J个序列小片段中加入纠错码,所述纠错码包括Reed-Solomon、汉明码;
对合成的所述DNA进行解码时,通过测序从合成的所述DNA中获取所述碱基序列;其中,使用引物对合成的DNA进行扩增;
根据所述N个不同的映射编码规则解码所述碱基序列,得到所述二进制数据,包括:所述碱基序列包括多个碱基组,所述碱基组与所述二进制单元相对应;采用所述N个不同的映射编码规则对所述碱基组进行解码,得到与所述碱基序列对应的所述二进制数据;
当所述碱基序列包括J个碱基子序列时,所述通过测序从合成的所述DNA中获取所述碱基序列,包括:
通过测序从合成的所述DNA中获取J个碱基子序列;
将所述J个碱基子序列拼接为所述碱基序列;
所述碱基子序列设置有索引标记,所述将所述J个碱基子序列拼接为所述碱基序列,包括:
根据所述索引标记,确定所述碱基子序列在所述碱基序列中的位置;
按照所述碱基子序列在所述碱基序列中的位置,将所述J个碱基子序列拼接为所述碱基序列。
2.如权利要求1所述的用于DNA数据存储的二进制信息到碱基序列的编解码方法,其特征在于,所述多个二进制单元中相隔N-1个二进制单元的两个二进制单元采用所述N个不同的映射编码规则中的同一个映射编码规则进行编码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011343923.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:病死动物尸体储存冷库
- 下一篇:一种高抗拉强度的铜合金铸造工艺
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置