[发明专利]一种针对二倍体PCR产物的Sanger测序中个体内SNP的识别方法有效
申请号: | 201310611263.1 | 申请日: | 2013-11-26 |
公开(公告)号: | CN103593659A | 公开(公告)日: | 2014-02-19 |
发明(设计)人: | 邓继忠;甘四明;黄华盛;李梅;于晓丽;袁之报;金济 | 申请(专利权)人: | 华南农业大学;中国林业科学研究院热带林业研究所 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06N3/02 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 杨晓松 |
地址: | 510642 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 二倍体 pcr 产物 sanger 测序中个 体内 snp 识别 方法 | ||
1.一种针对二倍体PCR产物的Sanger测序中个体内SNP的识别方法,其特征在于,包括以下步骤:
1)从二倍体PCR产物Sanger测序的色谱图形中分离腺瞟呤A、鸟瞟呤G、胞嘧啶C和胸腺嘧啶T四种碱基的荧光数据;
2)对提取的荧光数据进行滤波去噪处理;
3)分析步骤1)四种碱基荧光数据的波形特征,确定波形的周期,检测波形的第一峰与第二峰,选择波峰距离、高度比值和起伏度比值这三个波形特征,作为SNP位点判别的要素;
4)选择BP神经网络作为SNP位点检测的分类器,所述BP神经网络的结构为3-10-1,输入层的节点数是3,中间层∕隐含层节点数是10,输出层的节点数是1,并采用Levenberg Marquardt算法来对BP神经网络进行训练;
5)神经网络分类器的输出是介于0~45的一个数值,采用分段线性变换将输出映射为0~100的SNP评价分数,评价分数越高,则该位点属于SNP的可能性越大;
6)根据SNP评价分数,对SNP位点进行类别分级,分为1~5级,并据此判定该位点的SNP置信度。
2.根据权利要求1所述的一种针对二倍体PCR产物的Sanger测序中个体内SNP的识别方法,其特征在于:在步骤1)中,原始数据为Applied Biosystems公司的系列测序仪产生的、扩展名为.ab1的测序色谱图形文件,也可以是Beckman Coulter公司的测序仪产生的、扩展名为.scf的测序色谱图形文件,根据相应文件格式的说明,通过偏移量计算,将A、G、T和C四种碱基的荧光数据单独分离出来。
3.根据权利要求1所述的一种针对二倍体PCR产物的Sanger测序中个体内SNP的识别方法,其特征在于:在步骤2)中,所述滤波去噪处理是采用小波多尺度分析方法,对四种碱基序列数据单独处理,选择Daubechies小波的一阶函数db1作为小波基函数,用分解3层后的低频分解系数重构小波,重构的四种碱基的数据是后续进行SNP检测的分析数据。
4.根据权利要求1所述的一种针对二倍体PCR产物的Sanger测序中个体内SNP的识别方法,其特征在于:在步骤3)中,首先,检测荧光数据波峰出现的位置,计算波形的平均周期、最大波峰的平均高度;其次,检测每个波形周期内是否出现第二个波峰,双倍体内个体SNP检测的必要条件是SNP位点必定出现两个波峰,但两个波峰并非识别SNP的充分条件,两个波峰按其高度大小分别称为第一峰和第二峰,同时出现第一峰第二峰的位点为疑似SNP位点;最后,选择波峰距离、波峰高度比值、波峰起伏度比值这三个波形特征作为SNP位点判别的要素。
5.根据权利要求1所述的一种针对二倍体PCR产物的Sanger测序中个体内SNP的识别方法,其特征在于:在步骤4)中,所述BP神经网络分类器的输入量为波峰距离、波峰高度比值和波峰起伏度比值等这三个特征量,输出量是1个,是SNP的评价值,BP神经网络隐含层的传递函数选择S形的tansig函数,表达式如下式(1):
输出层的传递函数是线性的purelin函数,表达式如下式(2):
purelin(x)=x (2)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南农业大学;中国林业科学研究院热带林业研究所,未经华南农业大学;中国林业科学研究院热带林业研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310611263.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种QR码畸变图像的预处理方法
- 下一篇:无线胶囊内窥镜图像识别方法及系统