[发明专利]用于生物信息学信息表示的有效数据结构在审
申请号: | 201680090051.5 | 申请日: | 2016-10-11 |
公开(公告)号: | CN110088839A | 公开(公告)日: | 2019-08-02 |
发明(设计)人: | 丹尼尔·伦齐;乔吉奥·索亚 | 申请(专利权)人: | 耶诺姆希斯股份公司 |
主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B50/00 |
代理公司: | 上海华诚知识产权代理有限公司 31300 | 代理人: | 徐颖聪 |
地址: | 瑞士*** | 国省代码: | 瑞士;CH |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 用于表示以结构化文件格式所组织的基因组序列数据的方法和设备。数据结构包含核苷酸序列的表示:以压缩形式,比对并且参考一个或多个参考序列,并且根据不同的匹配准确度进行分类。分类并且比对的读段以语法元素层的形式被编码,包括标头信息的语法元素层被划分为独立或从属访问单元。 | ||
搜索关键词: | 数据结构 语法元素 比对 基因组序列数据 方法和设备 核苷酸序列 匹配准确度 生物信息学 标头信息 参考序列 访问单元 文件格式 信息表示 压缩形式 结构化 分类 从属 参考 | ||
【主权项】:
1.一种用于以基因组文件格式存储基因组序列数据的表示的方法,其特征在于,所述基因组序列数据包括核苷酸序列的读段,所述方法包括以下步骤:将所述读段与一个或多个参考序列进行比对,从而创建比对读段,根据与所述一个或多个参考序列的不同匹配准确度对所述比对读段进行分类,从而创建比对读段的类别;将分类的比对读段编码为语法元素层,用标头信息将所述语法元素层结构化,从而创建连续的访问单元,创建主索引表,所述主索引表包含每类比对读段的一个部分,所述一个部分包括每类数据的每个访问单元的第一读段在所述一个或多个参考序列上的映射位置;联合存储所述主索引表和所述访问单元数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于耶诺姆希斯股份公司,未经耶诺姆希斯股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201680090051.5/,转载请声明来源钻瓜专利网。