[发明专利]基因组结构变异注释方法在审
申请号: | 202110713095.1 | 申请日: | 2021-06-25 |
公开(公告)号: | CN113362889A | 公开(公告)日: | 2021-09-07 |
发明(设计)人: | 安玥;刘成林;魏从翀;张周;张之宏;揣少坤;汉雨生 | 申请(专利权)人: | 广州燃石医学检验所有限公司 |
主分类号: | G16B20/20 | 分类号: | G16B20/20 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 凃滔 |
地址: | 510300 广东省广州市黄埔区广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基因组 结构 变异 注释 方法 | ||
1.对基因组结构变异(SV)进行注释的方法,所述方法包括:
a.提供SV信息,所述信息包括SV的类型、方向(orientation)和两个断点坐标,其中所述SV类型包括缺失、重复、倒位和易位;
b.根据断点坐标对每个断点所处的基因、转录本和断点在转录本中的位置,以及所述转录本的方向信息,CDS的最小外显子编号和最大外显子编号进行注释,或者当所述断点位于基因之间的区域时将其注释为基因间区域;和
c.根据SV类型和步骤b中对每个断点的注释,对SV产生的突变类型进行注释。
2.权利要求1的方法,其中步骤a包括读取上游SV检测软件的分析结果以提取SV信息,优选所述SV变异检测软件选自Delly、Manta、LUMPY、GRIDSS和markSV;
可选地,其中步骤b包括:
b1.根据断点坐标将其注释为所述位置处的基因或基因间区域;
b2.确定b1中注释的基因的所有转录本及转录本的外显子、内含子、CDS和UTR信息,其中对于有指定转录本的基因选择该转录本进行注释,对于没有指定转录本的基因选择最长的转录本进行注释;
b3.根据断点在所述转录本中的位置,将其注释为位于UTR区域、外显子M或内含子N,其中M为所述断点所处的CDS区域的外显子编号,N为所述断点处于两个CDS区域之间时,外显子编号较小的CDS的外显子编号;和
b4.获取所述基因的所述转录本的方向信息(+/-链信息)、CDS的最小外显子编号和最大外显子编号。
3.权利要求1或2所述的方法,其中对突变类型进行注释包括对两个断点不在同一个基因内的SV进行注释,包括:
若两个断点都在基因间区域,则将突变类型注释为基因间变异;
若至少一个断点在基因区域,则将突变类型注释为基因融合;
优选地,其中对突变类型进行注释包括对两个断点位于同一个基因内且SV类型是缺失的SV进行注释,包括:
(1)若两个断点在同一个外显子上,则根据至少一个断点与外显子边缘的距离,将突变类型注释为剪接区域变异或蛋白质改变变异;优选地,根据缺失核苷酸数量是否为3个核苷酸的倍数,将所述蛋白质改变变异注释为符合读码框缺失或移码变异;
(2)若两个断点在同一个内含子上,则根据至少一个断点与内含子上下游边缘的距离,将突变类型注释为剪接位点变异、剪接区域变异或内含子变异;优选地,根据至少一个断点与内含子上游边缘的距离或内含子下游边缘的距离,将所述剪接位点变异注释为剪接受体变异或剪接供体变异;
(3)若至少一个断点在UTR区域,另一个断点在同一个UTR的上、下游基因间区域,根据该UTR区域,将突变类型注释为5’UTR变异或3’UTR变异;
(4)若两个断点中一个在5’UTR上且另一个在3’UTR上,则将突变类型注释为拷贝数缺失变异;
(5)对于其他情况,将突变类型注释为大片段基因组重排;
进一步优选地,其中对突变类型进行注释包括对两个断点位于同一个基因内且SV类型是重复的SV进行注释,包括:
(1)若两个断点在同一个外显子上或在相邻的外显子上,将突变类型注释为蛋白质改变变异;优选地,根据重复核苷酸数量是否为3个核苷酸的倍数,将所述蛋白质改变变异注释为符合读码框重复或移码变异;
(2)若两个断点中的一个在内含子上,且另一个在同一个内含子上或与该内含子相邻的外显子或UTR上,则将突变类型注释为内含子变异;
(3)若至少一个断点在UTR区域,另一个断点在同一个UTR区域的上、下游基因间区域,根据该UTR区域,将突变类型注释为5’UTR变异或3’UTR变异;
(4)若两个断点中一个在5’UTR上且另一个在3’UTR上,则将突变类型注释为拷贝数重复变异;
(5)对于其他情形,将突变类型注释为大片段基因组重排;
更进一步优选地,其中对突变类型进行注释包括对两个断点位于同一个基因内且SV类型是倒位的SV进行注释,包括:
(1)若两个断点在同一个外显子上,根据至少一个断点与外显子边缘的距离,将突变类型注释为剪接区域变异或蛋白质改变变异;优选地,根据突变后的编码框内是否有终止子,将所述蛋白质改变变异注释为终止获得或错义变异;
(2)若两个断点在同一个内含子上,则根据至少一个断点与外显子上游、下游边缘的距离将突变类型注释为剪接位点变异、剪接区域变异或内含子变异;优选地,根据至少一个断点与外显子上游边缘的距离或外显子下游边缘的距离,将所述剪接位点变异注释为剪接受体变异或剪接供体变异;
(3)若至少一个断点在UTR区域,另一个断点在同一个UTR区域的上、下游基因间区域,根据该UTR区域,将突变类型注释为5’UTR变异或3’UTR变异;
(4)对于其他情况,将其突变类型注释为大片段基因组重排。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州燃石医学检验所有限公司,未经广州燃石医学检验所有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110713095.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种畜牧用仔猪阉割固定装置
- 下一篇:一种畜牧用鹿茸切割梅花鹿稳定装置