[发明专利]用于从压缩的基因组序列读段重建基因组参考序列的方法和系统有效
申请号: | 201780086529.1 | 申请日: | 2017-12-14 |
公开(公告)号: | CN110603595B | 公开(公告)日: | 2023-08-08 |
发明(设计)人: | 克劳迪奥·阿尔贝蒂;穆罕默德·霍索·巴鲁克 | 申请(专利权)人: | 耶诺姆希斯股份公司 |
主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B50/00;G06F21/62;H03M7/30 |
代理公司: | 上海华诚知识产权代理有限公司 31300 | 代理人: | 徐颖聪 |
地址: | 瑞士*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 压缩 基因组 序列 重建 参考 方法 系统 | ||
1.一种用于编码包括核苷酸序列的读段的比对的基因组序列数据的计算机实施的方法,其特征在于,所述方法包括以下步骤:
·将所述读段与一个或多个参考序列进行比对,由此产生比对的读段,
·将要被编码的所述比对的读段映射到所述一个或多个参考序列上,
·组装所述比对的读段,由此产生重叠群,
·比较所述一个或多个参考序列和所述重叠群,由此获得与所述一个或多个参考序列和所述重叠群之间的错配位置和错配类型相关的信息,
·对与所述错配位置和所述错配类型相关的所述信息进行熵编码,并且
其中,分别使用第一描述符(203)和第二描述符(204)来指示与所述错配位置和所述错配类型相关的所述信息,并且所述第一描述符和所述第二描述符被封装在相同的访问单元中,以便能够在解码设备处选择性重建用于比对的所述一个或多个参考序列。
2.根据权利要求1所述的方法,其特征在于,组装所述比对的读段包括以下步骤:针对所述一个或多个参考序列上的每个位置,选择在所述位置处的所述比对的读段中出现频率最高的核苷酸。
3.根据权利要求1所述的方法,其特征在于,所述重叠群的长度被定义为所述编码器的输入参数或者由所述编码器动态调整。
4.根据权利要求3所述的方法,其特征在于,使用分割单元式截断一元二值化将所述第一描述符二值化,其中,所述分割单元式截断一元是重复的截断一元二值化的串联,其中,每个截断一元二值化被应用于要被二值化的值中的长度为N比特的部分,其中,N是预先选择的参数。
5.根据权利要求3所述的方法,其特征在于,使用截断一元二值化将所述第二描述符二值化,其中,所述第二描述符的值后跟着零,并且如果所述值等于要被二值化的最大可能值,则丢弃尾随的0比特。
6.根据权利要求3所述的方法,其特征在于,所述方法不对表示特定参考基因组的使用的信息进行编码。
7.根据权利要求4所述的方法,其特征在于,所述重叠群的所述长度被包含在语法报头中。
8.一种用于编码基因组序列数据的设备,其特征在于,所述基因组序列数据包括核苷酸序列的读段,所述设备包括用于以下步骤的装置:
·将所述读段与一个或多个参考序列进行比对,由此产生比对的读段,
·将要被编码的所述比对的读段映射到所述一个或多个参考序列上,
·组装所述比对的读段,由此产生重叠群,
·比较所述一个或多个参考序列和所述重叠群,由此获得与所述一个或多个参考序列和所述重叠群之间的错配位置和错配类型相关的信息,
·对与所述错配位置和所述错配类型相关的所述信息进行熵编码,并且
其中,分别使用第一描述符(203)和第二描述符(204)来指示与所述错配位置和所述错配类型相关的所述信息,并且所述第一描述符和所述第二描述符被封装在相同的访问单元中,以便能够在解码设备处选择性重建用于比对的所述一个或多个参考序列。
9.根据权利要求8所述的设备,其特征在于,用于组装所述比对的读段的所述装置还包括用于针对所述参考序列上的每个位置,选择在所述位置处的所述比对的读段中出现频率最高的核苷酸的装置。
10.根据权利要求8所述的设备,其特征在于,所述设备还包括接收所述重叠群的长度作为输入参数的装置和用于动态调整所述重叠群的长度的装置。
11.根据权利要求10所述的设备,其特征在于,所述设备还包括用于采用分割单元式截断一元二值化将所述第一描述符二值化的二值化装置,其中,所述分割单元式截断一元是重复的截断一元二值化的串联,其中,每个截断一元二值化被应用于要被二值化的值中的长度为N比特的部分,其中,N是预先选择的参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于耶诺姆希斯股份公司,未经耶诺姆希斯股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780086529.1/1.html,转载请声明来源钻瓜专利网。