[发明专利]用于从压缩的基因组序列读段重建基因组参考序列的方法和系统有效
申请号: | 201780086529.1 | 申请日: | 2017-12-14 |
公开(公告)号: | CN110603595B | 公开(公告)日: | 2023-08-08 |
发明(设计)人: | 克劳迪奥·阿尔贝蒂;穆罕默德·霍索·巴鲁克 | 申请(专利权)人: | 耶诺姆希斯股份公司 |
主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B50/00;G06F21/62;H03M7/30 |
代理公司: | 上海华诚知识产权代理有限公司 31300 | 代理人: | 徐颖聪 |
地址: | 瑞士*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开中描述的方法和设备包括依据描述所述参考基因组和与所述参考基因组先前比对的基因组序列之间差异的语法元素来表示参考基因组。借助语法元件的子集来描述每个比对的基因组序列。描述所有基因组序列的语法元素根据其统计性质按块分割。每个语法元素块被熵编码。然后,熵编码的块串联形成压缩的比特流。凭借语法元素表示参考基因组与比对的序列之间的差异,语法元素根据其统计性质按块分割,每个语法元素块被熵编码。这些熵编码的语法元素被嵌入描述比对的读段的语法元素的编码块的比特流中。所公开的方法使得能够在解码压缩的基因组序列时重建用于比对的参考基因组,同时保留对压缩的数据的随机访问的不同选项并且使得能够高效压缩。 | ||
搜索关键词: | 用于 压缩 基因组 序列 重建 参考 方法 系统 | ||
【主权项】:
1.一种用于编码基因组序列数据的方法,其特征在于,所述基因组序列数据包括核苷酸序列的读段,所述方法包括以下步骤:/n·将所述读段与一个或多个参考序列进行比对,由此产生比对的读段,/n·组装所述比对的读段,由此产生重叠群,/n·比较所述参考序列和所述重叠群,由此获得与错配位置和错配类型相关的信息,/n·对与所述错配位置和所述错配类型相关的所述信息进行熵编码。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于耶诺姆希斯股份公司,未经耶诺姆希斯股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201780086529.1/,转载请声明来源钻瓜专利网。