[发明专利]转录组序列分类方法、装置、电子设备及可读存储介质在审
申请号: | 202210074550.2 | 申请日: | 2022-01-21 |
公开(公告)号: | CN114496070A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 朱怀球;李墨;尹衡闯 | 申请(专利权)人: | 北京大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苟冬梅 |
地址: | 100871 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 转录 序列 分类 方法 装置 电子设备 可读 存储 介质 | ||
本发明实施例提供了一种转录组序列分类方法、装置、电子设备及计算机可读存储介质,本发明实施例中,转录组序列分类预测模型预先学习了多个已知类别的微生物的转录组序列的碱基序列、密码子序列和氨基酸序列,从而,本发明实施例采用的转录组序列分类预测模型,可以结合待分类转录组序列的碱基序列、密码子序列和氨基酸序列,准确地预测该待分类转录组序列所属的微生物类别。本发明实施例中,通过对转录组序列进行比对和预测,可以确定转录组序列所属的微生物类别。从而可以从虫媒介宏转录组中发现更多的未知的RNA病毒(主要的人类病毒),以作为疾病的检测、防控,以及新病毒或其他病原体的研究的基础。
技术领域
本发明涉及生物信息处理技术领域,特别是涉及一种转录组序列分类方法、装置、电子设备及计算机可读存储介质。
背景技术
虫媒介是指能够在不同宿主之间传播病原(包括细菌、病毒等致病微生物)的昆虫,例如蚊子、蜱虫等。虫媒介是重要的人类传染性病的传播途径,它们携带着大量人类致病原,尤其是病毒。当这些病原体接触到人时,会造成疾病,或者大范围流行病的发生,对人类健康造成巨大的威胁。例如,蚊子、蜱虫、白蛉、虱子等昆虫在对人进行叮咬时可能将其所携带的病原体传给人从而引起疾病,包括疟疾、登革热、黄热病、鼠疫等。对这些虫媒介所携带微生物的研究对于疾病的检测、防控,以及新病毒或其他病原体的发现具有重要意义。
目前,宏转录组测序方法是对虫媒介所携带的微生物进行检测的常规方法。宏转录组测序是指对特定样品中所有的RNA进行提取并进行高通量测序的研究技术。其中,所提取的RNA包含细胞及所有微生物的转录产物,及RNA病毒的基因组序列,从而可以对包含RNA病毒在内所有种类的微生物进行检测。
在人类疾病防控相关的研究中,研究者们常对媒介生物进行碾压,然后采用宏转录组的方式来检测及研究其中的可能感染人的病毒。这类研究通常采用去除核糖体RNA(rRNA)的total RNA-seq的方式进行测序,即,在提取样本中全部的RNA物质后,首先要去掉样品中大量的来源于环境宿主的rRNA,并进一步对RNA进行纯化后进行建库并测序。这样,测得的序列中包含了宿主的RNA序列、病毒、细菌、古菌、真菌等不同微生物的RNA序列,如果要对RNA序列所属的微生物类别进行鉴定,需要利用算法来实现。
然而,目前几乎所有的序列分类方法都是基于宏基因组测序的基础上所设计的,还没有专门针对宏转录组测序数据进行序列分类的方法。可以理解,宏基因组测序技术是通过对样品中所有的双链DNA物质进行提取并测序,对基因组的编码区和非编码区没有偏好性,且不包含样品中的RNA病毒的基因组;而宏转录组是通过对RNA进行富集及进行测序,序列主要来源于各类微生物的转录组和RNA病毒的基因组,从而在编码区序列上有更多富集。所以宏转录组测序样本和宏基因组测序样本在序列组成上有很大的差异。因此,基于宏基因组测序数据的序列分类方法无法应用于宏转录组测序数据。
由此可见,目前亟需一种可以实现对转录组序列进行准确地分类的技术方案。
发明内容
鉴于上述问题,提出了本发明实施例提供一种转录组序列分类方法、装置、电子设备及计算机可读存储介质,可以实现对虫媒介宏转录组中的转录组序列所属类别进行准确地鉴定。
本发明实施例的第一方面,提供了一种转录组序列分类方法,所述方法包括:
获取宏转录组中的待分类转录组序列;
将所述待分类转录组序列与已知数据库中的各个已知序列分别进行比对;
在比对成功的情况下,通过已知数据库确定所述待分类转录组序列所属类别;
在比对失败的情况下,利用转录组序列分类预测模型对所述待分类转录组序列所属类别进行预测;
其中,所述转录组序列分类预测模型预先学习了多个已知类别的微生物的转录组序列的碱基序列、密码子序列和氨基酸序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210074550.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种陶瓷粉体高频介电性能的评价方法
- 下一篇:车对车通讯方法及车辆通讯系统