[发明专利]用于DNA数据存储的编解码方法和编解码装置有效

专利信息
申请号: 202011343923.9 申请日: 2020-11-25
公开(公告)号: CN112382340B 公开(公告)日: 2022-11-15
发明(设计)人: 黄小罗;戴俊彪 申请(专利权)人: 中国科学院深圳先进技术研究院
主分类号: G16B30/00 分类号: G16B30/00;G16B40/00;G16B50/50
代理公司: 深圳中一联合知识产权代理有限公司 44414 代理人: 黄志云
地址: 518000 广东省深圳*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 dna 数据 存储 解码 方法 装置
【权利要求书】:

1.一种用于DNA数据存储的二进制信息到碱基序列的编解码方法,其特征在于,所述方法包括:

利用基准碱基组代表基准二进制单元,构建基于基准碱基组-基准二进制单元的映射编码规则库,其中,所述基准碱基组的碱基数为M,所述二进制单元的比特数为2M,且M为大于或等于2的整数,所述编码规则库大于等于20922789888000种;

获取待编码的二进制数据,所述二进制数据包括多个二进制单元;

采用N个不同的映射编码规则对所述多个二进制单元进行编码,得到与所述二进制数据对应的碱基序列,其中,N为大于或等于2的整数,所述碱基序列用于合成存储有与所述二进制数据对应的数据信息的DNA;所述N个不同的映射编码规则选自所述基准碱基组-基准二进制单元的映射编码规则库中的规则;

所述采用N个不同的映射编码规则对所述多个二进制单元进行编码,包括:

按照各个二进制单元的顺序,采用对应编号的映射编码规则进行编码;

或者,对二进制数据中的相邻的两个二进制单元,采用不同的映射编码规则进行编码,具体为:所述多个二进制单元包括p个二进制单元,其中,第一二进制单元采用第一映射编码规则,第二二进制单元采用除第一映射编码规则之外的任意一个映射编码规则,第三二进制单元采用除第二二进制单元采用的映射编码规则之外的任意一个映射编码规则,直到第p二进制单元采用除第p-1二进制单元采用的映射编码规则之外的任意一个映射编码规则;p为大于3的整数;

或者,所述二进制数据包括多条二进制子数据,把多条二进制子数据按照预设的规则混编成一条二进制数据后,再对混编后的二进制数据采用编码规则进行编码,具体为:

2条二进制子数据分别标记为第一二进制子数据和第二二进制子数据,按2bits作为一个单元将第一二进制子数据和第二二进制子数据划分成多个子单元,并对子单元进行排序;将第一二进制子数据和第二二进制子数据中相同排序位的子单元进行合并,将两条二进制子数据整合成第三二进制数据;

按4bits作为一个单元将第三二进制数据划分成多个二进制单元,对二进制单元进行奇数和偶数排序后,采用第一映射编码规则对位于奇数排位的二级制单元进行编码,采用第二映射编码规则对位于偶数排位的二进制单元进行编码,得到碱基序列;其中,对于待转化的二进制数据末尾不足一个二进制单元时,用0或1补齐后再进行编码;

所述方法还包括:

根据DNA合成技术能够合成的长度,将编码得到的碱基序列拆分成J个序列小片段,J为大于且小于200nt的正整数;

碱基子序列设置有索引标记,用于标记碱基子序列在碱基序列中的位置,所述索引标记添加在拆分的小片段左边或者右边;且在拆分的J个序列小片段两端还加上16-25个碱基的接头序列;且在拆分的J个序列小片段中加入纠错码,所述纠错码包括Reed-Solomon、汉明码;

对合成的所述DNA进行解码时,通过测序从合成的所述DNA中获取所述碱基序列;其中,使用引物对合成的DNA进行扩增;

根据所述N个不同的映射编码规则解码所述碱基序列,得到所述二进制数据,包括:所述碱基序列包括多个碱基组,所述碱基组与所述二进制单元相对应;采用所述N个不同的映射编码规则对所述碱基组进行解码,得到与所述碱基序列对应的所述二进制数据;

当所述碱基序列包括J个碱基子序列时,所述通过测序从合成的所述DNA中获取所述碱基序列,包括:

通过测序从合成的所述DNA中获取J个碱基子序列;

将所述J个碱基子序列拼接为所述碱基序列;

所述碱基子序列设置有索引标记,所述将所述J个碱基子序列拼接为所述碱基序列,包括:

根据所述索引标记,确定所述碱基子序列在所述碱基序列中的位置;

按照所述碱基子序列在所述碱基序列中的位置,将所述J个碱基子序列拼接为所述碱基序列。

2.如权利要求1所述的用于DNA数据存储的二进制信息到碱基序列的编解码方法,其特征在于,所述多个二进制单元中相隔N-1个二进制单元的两个二进制单元采用所述N个不同的映射编码规则中的同一个映射编码规则进行编码。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011343923.9/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top