[发明专利]基因组结构变异注释方法在审

专利信息
申请号: 202110713095.1 申请日: 2021-06-25
公开(公告)号: CN113362889A 公开(公告)日: 2021-09-07
发明(设计)人: 安玥;刘成林;魏从翀;张周;张之宏;揣少坤;汉雨生 申请(专利权)人: 广州燃石医学检验所有限公司
主分类号: G16B20/20 分类号: G16B20/20
代理公司: 北京市柳沈律师事务所 11105 代理人: 凃滔
地址: 510300 广东省广州市黄埔区广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基因组 结构 变异 注释 方法
【权利要求书】:

1.对基因组结构变异(SV)进行注释的方法,所述方法包括:

a.提供SV信息,所述信息包括SV的类型、方向(orientation)和两个断点坐标,其中所述SV类型包括缺失、重复、倒位和易位;

b.根据断点坐标对每个断点所处的基因、转录本和断点在转录本中的位置,以及所述转录本的方向信息,CDS的最小外显子编号和最大外显子编号进行注释,或者当所述断点位于基因之间的区域时将其注释为基因间区域;和

c.根据SV类型和步骤b中对每个断点的注释,对SV产生的突变类型进行注释。

2.权利要求1的方法,其中步骤a包括读取上游SV检测软件的分析结果以提取SV信息,优选所述SV变异检测软件选自Delly、Manta、LUMPY、GRIDSS和markSV;

可选地,其中步骤b包括:

b1.根据断点坐标将其注释为所述位置处的基因或基因间区域;

b2.确定b1中注释的基因的所有转录本及转录本的外显子、内含子、CDS和UTR信息,其中对于有指定转录本的基因选择该转录本进行注释,对于没有指定转录本的基因选择最长的转录本进行注释;

b3.根据断点在所述转录本中的位置,将其注释为位于UTR区域、外显子M或内含子N,其中M为所述断点所处的CDS区域的外显子编号,N为所述断点处于两个CDS区域之间时,外显子编号较小的CDS的外显子编号;和

b4.获取所述基因的所述转录本的方向信息(+/-链信息)、CDS的最小外显子编号和最大外显子编号。

3.权利要求1或2所述的方法,其中对突变类型进行注释包括对两个断点不在同一个基因内的SV进行注释,包括:

若两个断点都在基因间区域,则将突变类型注释为基因间变异;

若至少一个断点在基因区域,则将突变类型注释为基因融合;

优选地,其中对突变类型进行注释包括对两个断点位于同一个基因内且SV类型是缺失的SV进行注释,包括:

(1)若两个断点在同一个外显子上,则根据至少一个断点与外显子边缘的距离,将突变类型注释为剪接区域变异或蛋白质改变变异;优选地,根据缺失核苷酸数量是否为3个核苷酸的倍数,将所述蛋白质改变变异注释为符合读码框缺失或移码变异;

(2)若两个断点在同一个内含子上,则根据至少一个断点与内含子上下游边缘的距离,将突变类型注释为剪接位点变异、剪接区域变异或内含子变异;优选地,根据至少一个断点与内含子上游边缘的距离或内含子下游边缘的距离,将所述剪接位点变异注释为剪接受体变异或剪接供体变异;

(3)若至少一个断点在UTR区域,另一个断点在同一个UTR的上、下游基因间区域,根据该UTR区域,将突变类型注释为5’UTR变异或3’UTR变异;

(4)若两个断点中一个在5’UTR上且另一个在3’UTR上,则将突变类型注释为拷贝数缺失变异;

(5)对于其他情况,将突变类型注释为大片段基因组重排;

进一步优选地,其中对突变类型进行注释包括对两个断点位于同一个基因内且SV类型是重复的SV进行注释,包括:

(1)若两个断点在同一个外显子上或在相邻的外显子上,将突变类型注释为蛋白质改变变异;优选地,根据重复核苷酸数量是否为3个核苷酸的倍数,将所述蛋白质改变变异注释为符合读码框重复或移码变异;

(2)若两个断点中的一个在内含子上,且另一个在同一个内含子上或与该内含子相邻的外显子或UTR上,则将突变类型注释为内含子变异;

(3)若至少一个断点在UTR区域,另一个断点在同一个UTR区域的上、下游基因间区域,根据该UTR区域,将突变类型注释为5’UTR变异或3’UTR变异;

(4)若两个断点中一个在5’UTR上且另一个在3’UTR上,则将突变类型注释为拷贝数重复变异;

(5)对于其他情形,将突变类型注释为大片段基因组重排;

更进一步优选地,其中对突变类型进行注释包括对两个断点位于同一个基因内且SV类型是倒位的SV进行注释,包括:

(1)若两个断点在同一个外显子上,根据至少一个断点与外显子边缘的距离,将突变类型注释为剪接区域变异或蛋白质改变变异;优选地,根据突变后的编码框内是否有终止子,将所述蛋白质改变变异注释为终止获得或错义变异;

(2)若两个断点在同一个内含子上,则根据至少一个断点与外显子上游、下游边缘的距离将突变类型注释为剪接位点变异、剪接区域变异或内含子变异;优选地,根据至少一个断点与外显子上游边缘的距离或外显子下游边缘的距离,将所述剪接位点变异注释为剪接受体变异或剪接供体变异;

(3)若至少一个断点在UTR区域,另一个断点在同一个UTR区域的上、下游基因间区域,根据该UTR区域,将突变类型注释为5’UTR变异或3’UTR变异;

(4)对于其他情况,将其突变类型注释为大片段基因组重排。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州燃石医学检验所有限公司,未经广州燃石医学检验所有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110713095.1/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top