[发明专利]一种宏基因组绝对定量实验全流程的数字孪生方法在审
申请号: | 202210504609.7 | 申请日: | 2022-05-10 |
公开(公告)号: | CN115019886A | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | 徐韬;王璇;黎昞;吴波;朱越;王旭;李朝阳;郭忠昌;白玉琼 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G16B20/30 | 分类号: | G16B20/30;G16B5/00 |
代理公司: | 西安凯多思知识产权代理事务所(普通合伙) 61290 | 代理人: | 赵革革 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 宏基 绝对 定量 实验 流程 数字 孪生 方法 | ||
1.一种宏基因组绝对定量实验全流程的数字孪生方法,其特征在于,包括如下模块:
模块1:构建样本库;
设定菌群的相对定量信息,包括每种菌的名称代号、各种菌之间的比例关系和DNA序列的总数量;各种菌的比例和为1;
通过现有的微生物信息DNA库,根据各种菌之间的比例关系和DNA序列的总数量,确定整个菌群的绝对定量信息,模拟用户需要的菌群环境;
DNA序列的总数量乘以菌株的相对定量为该菌株的绝对定量,即需要从现有微生物信息DNA库中提取的菌株DNA的数量;最终将所有菌株提取完毕,生成用户需要的菌群环境,即样本库;
模块2:构建内标库;
内标库的生成有两种方式:一种是用户自定义内标,需要用户自定义输入菌群的相对定量信息和DNA序列的总数量,并且用户设定的菌株需要满足与样本库中相似度低于80%的条件;另一种是系统自动生成内标,不需要用户额外输入,系统自动根据样本库挑选相似度低于80%的菌群,生成内标库;内标库生成的总量为样本库的0.1%、1%、10%三种内标浓度供用户选择;
采用两种方式插入内标:一种是在步骤1中提取菌株DNA前插入,加入内标后一起提取,内标会和DNA一起提取,这种插入方式只在后续测序过程产生误差;第二种方式是在步骤1中提取菌株DNA后插入内标DNA,由于DNA会在提取过程中产生误差,而内标DNA没有这部分误差,此时会在提取和测序中产生两段误差;
模块3:宏基因组分析流程;
本模块分为四个步骤;
步骤1:提取样本;
在提取样本时,本模块会随机生成95%-100%之间保留两位小数的百分数,作为本次提取的回收率;样本提取后将DNA序列随机切断成长度为300bp-500bp之间的片段,随机切断后的DNA库作为待测序文库以作测序使用;
步骤2:测序;
对待测序文库中的DNA序列进行模拟测序,测序是将生物信息中的“ACGT”四种碱基转换为电子信息“ACGT”四种字母,在本步骤中,直接将步骤1中的DNA数据作为测序的结果;
采用梯度方式模拟测序误差,具体实现如下:测序长度为150bp,前100bp的误差设置为一个固定的值0.01%,随着测序的后移,误差呈梯度上升的,在最后达到峰值;梯度上升过程是非线性上升的,波动范围为0.5%-2%;
步骤3:计算;
通过下式计算微生物群落的绝对定量的归一化因子:
其中,n为插入的内标DNA总数,此项为用户输入;Cs,i为第i个内标DNA的浓度,此项在生成内标DNA库时得到;Zs,i为第i个内标DNA的reads数,此项在生成内标DNA库时得到;Ls,i为第i个内标DNA的的碱基长度,此项为固定长度150bp,如果在提取前加入内标则是打断后的长度;
步骤4:分析对比;
归一化因子乘以未知样本DNA的Zt/Lt,即得到未知样本DNA的浓度;Zt、Lt分别表示样本DNAt的reads数和碱基长度,都是在测序后得到;然后用未知样本DNA的相对定量乘样本总量得到未知样本DNA的绝对定量,将结果与模块1中生成DNA库时的绝对定量进行对比,观察内标法绝对定量的精确度;
通过对比两种内标插入方式和三种内标浓度来比较内标法的效果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210504609.7/1.html,转载请声明来源钻瓜专利网。