[发明专利]一种基于二代测序的PEDV病毒基因组分析方法有效
申请号: | 201911381880.0 | 申请日: | 2019-12-27 |
公开(公告)号: | CN111199772B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 崔天一;孙子奎 | 申请(专利权)人: | 上海派森诺生物科技股份有限公司 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B30/00 |
代理公司: | 上海天翔知识产权代理有限公司 31224 | 代理人: | 吕伴 |
地址: | 200030 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 二代 pedv 病毒 基因组 分析 方法 | ||
本发明公开了一种基于二代测序的PEDV病毒基因组分析方法,其特征在于,包括如下步骤:下载宿主猪的基因组序列和转录本序列,作为宿主参考序列;获得去宿主污染的测序序列;拼接基因组;将基因组进行同源比对;挑选比对结果;将比对的起始位点作为基因的起始位点。本发明与现有技术相比,能够准确预测出基因结构,避免遗漏。
技术领域
本发明涉及基因检测领域,具体涉及一种基于二代测序的PEDV病毒基因组分析方法。
背景技术
目前现有的PEDV分析方法两方面的局限,第一,PEDV病毒二代测序数据中存在部分甚至大量的宿主猪的基因组序列,宿主基因组的污染会影响PEDV病毒基因组的拼接。第二,拼接预测病毒基因结构的方法主要是GeneMarkS等预测软件,但由于PDEV病毒基因组中基因相互重叠,其中基因内部还存在Ribosomal frameshift现象,现有的基因预测软件并不能准确识别出正确的基因结构。
发明内容
为了克服现有技术的上述缺陷,本发明的目的在于提供一种基于二代测序的PEDV病毒基因组分析方法。
与现有的方法相比,本发明的分析方法通过拼接基因组方面利用比对的策略去除数组基因组污染再用Spades拼接软件进行拼接。再基因结构识别方面搜集相近病毒基因组的基因信息并通过整理形成PEDV病毒基因序列的数据库,再利用同源预测的方式进行基因预测。
为了实现本发明的目的,所采用的具体的技术方案是:
一种基于二代测序的PEDV病毒基因组分析方法,包括如下步骤:
1)下载宿主猪的基因组序列和转录本序列,作为宿主参考序列;
2)运行Bowtie2软件,将测序数据与所述步骤1中的宿主参考序列进行比对,剔除比对到宿主序列的测序数据。获得去宿主污染的测序序列;
3)根据PEDV基因组大小150X的数据量从所述步骤2当中获得的去宿主污染的测序序列中截取用于拼接的序列;
4)运行SPAdes软件,参数设置为k-mer分别设置为55,77,121,cov-cutoff值设置为auto,以所述步骤3当中获得的序列作为输入,拼接基因组;
5)利用NCBI网站自带的Edirect软件,批量下载NCBI数据库中的所有PEDV病毒的基因序列;
6)运行makeblastdb软件,将步骤所述步骤5当中下载的基因序列作为输入构建数据库;
7)运行blast软件,将所述步骤4当中拼好的基因组,与所述步骤6当中构建的数据库进行同源比对;
8)挑选比对结果时Total score值最大的结果作为最终结果;
9)根据所述步骤8当中挑选的比对结果,将比对的起始位点作为基因的起始位点。
在本发明的一个优选实施例中,所述运行Bowtie2软件为运行默认参数。
本发明的有益效果在于:
本发明与现有技术相比,能够准确预测出基因结构,避免遗漏。
附图说明
图1为本发明的实施例的基因预测结果示意图。
图2为本发明的对比例的基因预测结果示意图。
图3为本发明的流程图。
具体实施方式
下面通过具体实施例对本发明进行进一步说明。
实施例1:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海派森诺生物科技股份有限公司,未经上海派森诺生物科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911381880.0/2.html,转载请声明来源钻瓜专利网。