[发明专利]用于呈现重排或融合结构亚型的方法、设备和介质有效
申请号: | 202210443269.1 | 申请日: | 2022-04-25 |
公开(公告)号: | CN114822700B | 公开(公告)日: | 2023-02-17 |
发明(设计)人: | 王凯;袁少华;陈惠 | 申请(专利权)人: | 至本医疗科技(上海)有限公司;上海至本医学检验所有限公司 |
主分类号: | G16B45/00 | 分类号: | G16B45/00;G16B20/00;G16B30/10 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 张平 |
地址: | 201203 上海市浦东新*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 呈现 重排 融合 结构 方法 设备 介质 | ||
本发明涉及一种用于呈现重排或融合结构亚型的方法、设备和介质。该方法包括:生成包括有基因结构注释信息的基因注释文件,基因结构注释信息至少指示:外显子或内含子编号、基因名称、每个基因使用的NM号、基因转录方向和外显子的总数目;基于待测样本的成对序列的双末端测序数据与参考基因组序列的比对结果数据,确定基因融合对的融合支持序列,以用于生成含有融合支持序列的对比结果文件;将对比结果文件和所生成的注释文件加载入基因组浏览器;以及获取断点所在基因位置,以便经由基因组浏览器生成图像数据,以用于基于所生成的图像数据确定重排或融合结构亚型。本发明能够通过可视化方法来读取重排断点所在的基因结构和重排后形成的亚型结构。
技术领域
本发明总体上涉及生物信息的处理与可视化,并且具体地,涉及用于呈现重排或融合结构亚型的方法、计算设备和计算机存储介质。
背景技术
重排和融合的亚型在临床上具有重要意义,比如,EML4-ALK融合基因有多个亚型,不同的EML4-ALK参与亚型具有不同的临床靶药效果与预后。可视化直观展示重排或融合在参与基因A和B上的位置,以及重排后的形成结构具有重要的临床和证据意义。
传统的用于呈现基因组的方案,例如是基因组浏览器igv软件,其可以针对高通量测序数据进行可视化的呈现。不过,在传统的用于呈现基因组的方案中,所呈现的注释信息中仅包括基因名字,需要通过人工观察断点两边对应的外显子,来读取断点所在的基因和内含子或外显子,而不能直接快速地清晰得知断点所在基因结构和重排后的新组成亚型。
综上,传统的用于呈现基因组的方法难以通过可视化方法来读取重排断点所在的基因结构和重排后形成的亚型结构。
发明内容
本发明提供一种用于呈现重排或融合结构亚型的方法呈现重排或融合结构亚型的方法、计算设备和计算机存储介质,能够通过可视化方法来读取重排断点所在的基因结构和重排后形成的亚型结构。
根据本发明的第一方面,提供了一种用于呈现重排或融合结构亚型的方法。该方法包括:生成包括有基因结构注释信息的基因注释文件,基因结构注释信息至少指示:外显子或内含子编号、基因名称、每个基因使用的NM号、基因转录方向和外显子的总数目;基于待测样本的成对序列的双末端测序数据与参考基因组序列的比对结果数据,确定基因融合对的融合支持序列,以用于生成含有融合支持序列的对比结果文件,成对序列是经由针对待测样本的多个测序片段进行双末端测序而获得的;将含有融合支持序列的对比结果文件和所生成的注释文件加载入基因组浏览器;以及获取断点所在基因位置,以便经由基因组浏览器生成图像数据,以用于基于所生成的图像数据确定重排或融合结构亚型,图像数据至少指示断点区间和与断点区间相对应的基因结构注释信息。
根据本发明的第二方面,还提供了一种计算设备,该设备包括:存储器,被配置为存储一个或多个计算机程序;以及处理器,耦合至存储器并且被配置为执行一个或多个程序使装置执行本发明的第一方面的方法。
根据本发明的第三方面,还提供了一种非瞬态计算机可读存储介质。该非瞬态计算机可读存储介质上存储有机器可执行指令,该机器可执行指令在被执行时使机器执行本发明的第一方面的方法。
在一些实施例中,生成包括有基因结构注释信息的基因注释文件包括:基于基因组位置,划分外显子和内含子,以便针对划分后的外显子和内含子按顺序编号,以用于生成待添加的基因结构注释信息;将基因名称替换为待添加的基因结构注释信息,以便生成包括基因结构注释信息的第一格式的基因注释文件;基于外显子和内含子,生成比对结果的输出格式的比对块信息,以便基于第一格式的基因注释文件和比对块信息构建用于呈现参考基因组的第二格式的基因注释文件,比对块信息包括块数目列信息、块尺寸列信息、查询序列的起点位置列信息、参考基因的染色体起点位置列信息;以及建立第二格式的基因注释的索引文件。
在一些实施例中,第一格式的基因注释文件为bed格式的基因注释文件,第二格式的基因注释文件为psl格式的基因注释文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于至本医疗科技(上海)有限公司;上海至本医学检验所有限公司,未经至本医疗科技(上海)有限公司;上海至本医学检验所有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210443269.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:半导体装置及其制造方法
- 下一篇:数据读取方法、装置、终端设备及存储介质