[发明专利]一种基于宏基因组测序数据组装病原微生物基因组的方法有效

专利信息
申请号: 202210732531.4 申请日: 2022-06-27
公开(公告)号: CN115101129B 公开(公告)日: 2023-03-24
发明(设计)人: 林鹏;张跃;梁园园;王凯琳;王志卫 申请(专利权)人: 青岛华大医学检验所有限公司
主分类号: G16B30/00 分类号: G16B30/00
代理公司: 青岛智地领创专利代理有限公司 37252 代理人: 王晓凤
地址: 266000 山东省*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种基于宏基因组测序数据组装病原微生物基因组的方法。该方法将原始数据过滤后与宿主数据库进行比对,以达到在数据层面进行去除宿主序列的目的;再使用soapdenovo对去宿主的reads进行组装,得到无参组装的contig序列,将病源数据库作为参考基因组,然后统计去宿主的reads比对情况中每个位点的测序深度,得到有参组装的contig,将无参组装的contig序列和有参组装的contig序列进行整合,得到合并后的contig序列,并进行病原的判别。本发明通过去宿主后,采取无参组装和有参组装相结合的方法进行病原微生物的组装,得到的宏基因组没有宿主的污染,并且在点突变以外加入了结构变异的信息,准确度更高。
搜索关键词: 一种 基于 宏基 序数 组装 病原微生物 基因组 方法
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛华大医学检验所有限公司,未经青岛华大医学检验所有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202210732531.4/,转载请声明来源钻瓜专利网。

同类专利
  • 亲和力预测方法、装置、计算机设备及存储介质-202310562554.X
  • 何冰;何昊淮;姚建华;赵宇 - 腾讯科技(深圳)有限公司
  • 2023-05-18 - 2023-10-27 - G16B30/00
  • 本申请实施例公开了一种亲和力预测方法、装置、计算机设备及存储介质,属于计算机技术领域。该方法包括:获取抗原序列信息和抗体序列信息,抗体序列信息包括抗体序列的轻链序列信息和重链序列信息,抗原序列信息表示抗原序列中的氨基酸;分别对抗原序列信息、轻链序列信息和重链序列信息进行特征提取,得到抗原序列特征、轻链序列特征和重链序列特征;对抗原序列特征、轻链序列特征和重链序列特征进行融合,得到融合序列特征;对融合序列特征进行全连接,得到亲和力检测结果,亲和力检测结果表示抗体序列对抗原序列的亲和力。本申请不仅考虑的因素较为全面,而且还划分了重链与轻链两个粒度,有利于提高预测亲和力的准确性。
  • 抗体序列生成方法、装置、计算机设备及存储介质-202310566319.X
  • 何冰;何昊淮;姚建华;赵宇 - 腾讯科技(深圳)有限公司
  • 2023-05-18 - 2023-10-27 - G16B30/00
  • 本申请实施例公开了一种抗体序列生成方法、装置、计算机设备及存储介质,属于计算机技术领域。该方法包括:获取抗原序列信息,抗原序列信息表示抗原序列中的氨基酸;对抗原序列信息进行特征提取,得到抗原序列信息的抗原序列特征;对抗原序列特征进行特征解码,得到每个位置的预测概率,预测概率包括位置上的氨基酸属于多种氨基酸中每种氨基酸的预测概率;将每个位置上预测概率最大的氨基酸构成的序列信息,确定为抗体序列信息,抗体序列信息指示的抗体序列能够与抗原序列结合。本申请针对特定抗原序列生成了能够与之结合的抗体序列,提高了生成抗体序列的针对性。
  • 蛋白质相互作用的预测方法、装置、设备、介质及产品-202310635537.4
  • 吴家祥 - 腾讯科技(深圳)有限公司
  • 2023-05-31 - 2023-10-27 - G16B30/00
  • 本申请公开了一种蛋白质相互作用的预测方法、装置、设备、介质及产品,属于机器学习技术领域。该方法包括:获取至少两个蛋白质分别对应的氨基酸序列;基于氨基酸序列对注意力语言网络的网络参数进行自适应调整,得到调整后的自适应注意力语言网络;基于自适应注意力语言网络对至少两个蛋白质分别对应的氨基酸序列进行特征提取,得到至少两个蛋白质分别对应的氨基酸序列特征;基于预测网络对至少两个蛋白质分别对应的氨基酸序列特征进行相互作用预测,得到至少两个蛋白质对应的预测结果。通过上述方法,在蛋白质相互作用的预测过程中,可以将注意力语言网络的网络参数进行适应性调整,提高了相互作用预测模型的泛化能力,同时提高了预测精度。
  • 复合物结构预测方法、装置、计算机设备及存储介质-202310631412.4
  • 赵宇;黄悦珊;姚建华;何冰 - 腾讯科技(深圳)有限公司
  • 2023-05-31 - 2023-10-27 - G16B30/00
  • 本申请实施例公开了一种复合物结构预测方法、装置、计算机设备及存储介质,涉及人工智能领域。包括:获取抗原肽序列、主要组织相容性复合体MHC结构以及T细胞受体TCR结构;将抗原肽序列和MHC结构输入第一图神经网络,得到第一复合物的第一结构预测结果,第一复合物为pMHC复合物,第一图神经网络用于对抗原肽序列和MHC结构进行柔性对接;将TCR结构和第一结构预测结果输入第二图神经网络,得到第二复合物的第二结构预测结果,第二复合物为TCR‑pMHC复合物,第二图神经网络用于对TCR结构和第一结构预测结果进行刚性对接。采用本申请实施例的方法,可以实现对TCR‑pMHC复合物结构的高效预测。
  • 一种坡耕地垄沟布局对微生物影响机理的识别方法-202111041681.2
  • 樊晶晶;刘姗姗;秦天玲;赵爽;严登华;林帅;董碧琼;冯贱明 - 中国水利水电科学研究院
  • 2021-09-07 - 2023-10-24 - G16B30/00
  • 本发明提供了一种坡耕地垄沟布局对微生物影响机理的识别方法,属于土壤微生物学技术领域,包括:确定坡耕地垄沟布局参数;布设实验小区和对照小区;进行土壤微生物高通量测序,得到土壤微生物群落结构多样性相关指数和土壤碳氮循环过程功能基因丰度数据;确定对所述土壤微生物群落结构多样性相关指数和土壤碳氮循环过程功能基因丰度数据产生影响的坡耕地垄沟布局参数的主次顺序;构建线性回归方程;对所述线性回归方程进行显著性检验,完成对坡耕地垄沟布局对微生物影响机理的识别。本发明选择四种具有代表性的垄沟布局参数,通过高通量测序技术对不同垄沟布局下土壤微生物群落多样性进行分析,识别坡耕地垄沟布局对土壤微生物影响机理,为制定合适的坡耕地垄沟布局方式提供参考。
  • 一种基于微生物组测序数据预测肠道年龄指数的人工智能模型和方法-202310811722.4
  • 李明定;鲍志炜 - 浙江迈亚塔菌检智能科技有限公司
  • 2023-07-04 - 2023-10-20 - G16B30/00
  • 本发明提供了一种基于微生物组测序数据预测肠道年龄指数的人工智能模型和方法;通过机器学习算法和统计偏差校正方法,构建的人工智能机器学习肠道年龄预测模型,并基于健康队列计算校正值,对待预测的数据样本进行肠道年龄校正,从而计算计算肠道年龄指数;预测肠道年龄和GAI可用于肠道健康状况的评估和慢性疾病的预测等领域;本发明的临床前验证结果表明其具有较高的准确率,GAI在20种常见慢性疾病中的计算准确率在65.9%到74.8%之间,如代谢综合征、肥胖症和心血管疾病等,其中动脉硬化的准确率高达74.8%;该方法还具有特征性好,普适性强等优点,在大健康领域具有较强的应用价值。
  • 一种基于多模态的T细胞受体序列分类方法-202311174331.2
  • 刘峻江;周树森;王庆军;臧睦君;柳婵娟;刘通 - 鲁东大学
  • 2023-09-13 - 2023-10-20 - G16B30/00
  • 本发明属于生物信息学领域,涉及一种基于多模态的T细胞受体序列分类方法,将T细胞受体的空间结构特征与序列特征融合在一起,旨在提高T细胞受体序列的分类能力。该方法使用了一种新型的编码方式将T细胞受体序列的原子空间结构与序列特征进行结合,并在联合训练前进行预训练。在预训练结束后,将空间特征提取模块与序列特征提取模块进行联合训练并取得预测结果。该方法的步骤包括:T细胞受体空间结构预处理、T细胞受体序列预处理、空间特征提取模块预训练、空间特征提取模块与序列特征提取模块联合训练四个步骤。该方法可有效融合T细胞受体的空间结构特征和序列特征,并得到更优的效果,对疾病的检测、治疗、预后具有重要意义。
  • 一种用于B细胞的抗原表位预测方法-202111537519.X
  • 羊红光;周云飞;成彬 - 河北省科学院应用数学研究所
  • 2021-12-15 - 2023-10-20 - G16B30/00
  • 一种用于B细胞的抗原表位预测方法,所述方法首先组成预训练集合PT;在Q_learning算法的每一个episode中,Q代理以蛋白质一级序列中任意8个连续的氨基酸残基为状态,以从每个状态后面的12个连续残基中选择k个残基并入该状态作为第一个动作;以选择n个互补的分类器之一作为第二动作选项,按照连续动作搜索法在PT中进行搜索,对搜索出的氨基酸序列由倾向性奖励法则给出即时奖励,计算Q值并更新,直到价值函数的变化小于1%时结束训练;然后用训练得到的策略在蛋白质一级序列中搜索出氨基酸序列,并由选出的分类器进行分类。本发明通过自动迭代大大增强了B细胞抗原表位的预测能力,提高了抗原表位分类的准确率。
  • 识别核酸中的碱基的方法和系统-201911331502.1
  • 李林森;金欢;姜泽飞;孙雷 - 深圳市真迈生物科技有限公司
  • 2019-12-21 - 2023-10-20 - G16B30/00
  • 本发明公开了一种识别核酸中的碱基的方法、一种计算机可读存储介质、一种计算机程序产品和一种系统。所称的识别核酸中的碱基的方法包括将对应于模板的亮斑集合中的每个亮斑的坐标映射到待检图像上,确定待检图像上相应坐标的位置;确定待检图像上相应坐标的位置的信号的强度,该强度为矫正后的强度;以及比较待检图像上相应坐标的位置的信号的强度与第一预设值的大小,基于比较结果判断该位置对应的碱基类型,实现碱基识别。该方法能够快速且准确地识别碱基,实现模板的至少一部分序列的核苷酸/碱基的次序的测定。
  • 一种设计靶序列的方法及系统-202310802050.0
  • 陈小玲;黄尚飞;陈英;芦志龙;陆琦;陈东;王青艳;吴艳玲 - 广西科学院
  • 2023-07-03 - 2023-10-13 - G16B30/00
  • 本发明公开了一种设计靶序列的方法及系统,包括以下步骤:判断当目标序列上有GG(或AG)碱基时,读取所述碱基及所述碱基之前的序列,所述序列的长度为mbp,其中,m≤50;以所述序列为靶序列模型,编辑所述靶序列模型,构建靶序列,其中,所述编辑包括剪切、输入序列信息或读取序列文件;根据所述靶序列评分标准对所述靶序列的序列特征进行分析判断,赋予相应分值后,输出靶序列及其评分数值。本发明方法能为设计的靶序列添加所需的碱基序列,避免人工添加设计的靶序列部分错误而导致基因编辑试验失败。
  • 一种数据评测方法、装置、电子设备及存储介质-202211111810.5
  • 王丹阳;陈懂懂;袁静贤 - 郑州思昆生物工程有限公司
  • 2022-09-13 - 2023-10-13 - G16B30/00
  • 本公开提供了一种数据评测方法、装置、电子设备及存储介质,该方法包括:获取待评测特征数据,其中,所述待评测特征数据为测序仪器对任一批次的样本基因数据进行测序后得到的;利用至少一种异常值检测算法,对所述待评测特征数据进行检测,确定所述待评测特征数据对应的数据测试结果;其中,所述数据测试结果用于指示所述待评测特征数据内处于异常状态的测序流通槽信息、拍摄视场的视场标识、视场数量、测序循环数的循环标识、循环数量中的至少一种;基于所述待评测特征数据对应的数据检测结果,生成针对所述测序仪器的测序评测结果。
  • 程序化框架gRNA及其应用-202010438038.2
  • 陆志科;马丽佳;宋庆凯 - 西湖大学
  • 2020-05-21 - 2023-10-13 - G16B30/00
  • 本发明涉及一种程序化框架gRNA及其应用。与亲本框架gRNA相比,所述程序化框架gRNA在Tetraloop、Loop2和Tail中的任一结构中引入腺嘌呤/鸟嘌呤混合捕获序列修饰,其中所述腺嘌呤/鸟嘌呤混合捕获序列选自SEQ ID No:1‑9中的任一项。本发明还涉及包含程序化框架gRNA的gRNA表达盒或双gRNA表达盒。本发明还涉及包含所述程序化框架gRNA、gRNA表达盒或双gRNA表达盒的载体或细胞。本发明的程序化框架gRNA、gRNA表达盒或双gRNA表达盒可以替代亲本框架gRNA用于CRISPR筛选,CRISPR筛选得到的细胞群可用于构建单细胞测序用的文库。
  • 基于微生物代谢背景的宏基因组队列匹配方法-202310748085.0
  • 吴顶峰;刘蕾;曹苏琪;杨柳;俞刚;李竞 - 浙江大学医学院附属儿童医院
  • 2023-06-25 - 2023-10-10 - G16B30/00
  • 本发明公开了基于微生物代谢背景的宏基因组队列匹配方法,涉及宏基因组技术领域。S1:宏基因组测序数据处理;对来自全宏基因组学的数据和手动输入的meta数据进行标准化处理;S2:微生物主要代谢背景提取;S3:微生物代谢背景匹配;首先通过最近邻匹配算法在不遗漏任何主要代谢成分的情况下,筛选对照组中匹配的样本;S4:匹配效果检查;对匹配后的疾病组和对照组的协变量均值进行平衡性检验;S5:基于匹配队列的差异分析;匹配后的疾病组和对照组数据符合正态分布,则进行配对样本t检验进行差异分析,否则使用成组wilcoxon检验进行差异分析。通过本技术方法,实现微生物研究中病例和对照样本匹配队列的构建,加强宏基因组学研究的因果关系识别能力。
  • 一种香蕉种质资源分子鉴定的方法-202310588139.1
  • 曾鸿运;吴元立;黄秉智 - 广东省农业科学院果树研究所
  • 2023-05-23 - 2023-10-10 - G16B30/00
  • 本发明属于分子生物学技术领域,公开了一种香蕉种质资源分子鉴定的方法,具体公开了一种用于香蕉种质资源分子鉴定的数据库,所述数据库包括特征序列,所述特征序列包括GGKRKDRDNRN、GGKGGDRDNVN、GGGGGGKDK、GGGGKKKKK以及如SEQ ID NO:5~23所示特征序列中的至少一种。本发明首次公开了用于香蕉种质资源分子鉴定的数据库,该数据库是通过对香蕉样品的一代测序峰图进行分析得到的,其更加可靠、稳定、丰富和准确,实现简单、快速、更精准地判定香蕉的类别。
  • 一种获取第一源抗体序列对应的第二源蛋白质序列的方法与设备-202310835230.9
  • 邹鸿刚;许锦波 - 北京分子之心科技有限公司
  • 2023-07-07 - 2023-10-03 - G16B30/00
  • 本申请的目的是提供一种获取第一源抗体序列对应的第二源蛋白质序列的方法与设备,该方法包括:基于蛋白质序列集合,构建所述蛋白质序列集合对应的蛋白质子序列搜索池;确定第一源抗体序列对应的第二表征信息;基于所述第二表征信息,从所述蛋白质子序列搜索池确定多个候选蛋白质子序列;基于所述多个候选蛋白质子序列,确定所述第一源抗体序列对应的第二源蛋白质序列。本申请从第一源抗体序列中氨基酸的理化功能出发,确定相匹配的第二源蛋白质序列,从而在保证抗原亲和性的基础上,有效降低获得的第二源蛋白质序列的免疫原性。本申请还可以确定第二源蛋白质序列中各氨基酸位点对应的候选氨基酸,以便于后续进行回复突变,提高回复突变效率。
  • 基于单细胞测序从头预测调控突变的系统、设备和介质-202310594391.3
  • 郭国骥;肖彦宇;王晶晶;李佳琦 - 浙江大学
  • 2023-05-23 - 2023-10-03 - G16B30/00
  • 本发明公开了一种基于单细胞测序从头预测调控突变的系统、设备和介质,属于单细胞测序技术领域。所述系统利用卷积神经网络,提取基因转录起始位点周围的染色质特征,并通过回归方法,由染色质特征拟合细胞亚群特异性的基因表达,为每细胞亚群分别训练特异性的预测模型;进一步利用预测模型,预测细胞亚群特异性调控突变位点。本发明的系统能够显著提升预测结果的精准度,使其成为一种研究细胞亚群水平遗传调控的通用的方法,在细胞功能基因组学领域具有巨大的应用价值。
  • 基于图注意机制的肽序列标签鉴定方法-202310866226.9
  • 李闯;刘纯洋;李小龙;何典;黄华;王和诗 - 湖南工商大学
  • 2023-07-14 - 2023-09-29 - G16B30/00
  • 本公开实施例中提供了一种基于图注意机制的肽序列标签鉴定方法,属于生物信息学技术领域,具体包括:对二级质谱图进行预处理,并基于图论构建谱峰连接图生成候选肽序列标签集;利用标签注意力模块构建标签嵌入矩阵,从训练数据中提取候选序列标签集中标签之间的顺序相关性;通过卷积神经网络模块进行特征提取,并将特征作为通道注意力模块的输入提取蛋白质序列的组成相关性;将标签注意力模块和通道注意力模块融合,构建完整的标签分类模型,从而生成肽序列标签;将肽序列标签在蛋白质数据库中进行搜索得到理论质谱图,并其与实验质谱图进行匹配打分,得到二级质谱图对应的蛋白质序列。通过本公开的方案,提高了计算效率、精准度和适应性。
  • 等温扩增核酸的结果判定方法、系统、设备及存储介质-202310847533.2
  • 葛永兵;贺志民;陈翀 - 广州普世君安生物科技有限公司
  • 2023-07-12 - 2023-09-29 - G16B30/00
  • 本发明提出了一种等温扩增核酸的结果判定方法、系统、设备及存储介质,在上样后待测样本确定样本源后确定目标基因的方法包括:获取反应检测体系中每单位时间点采集的用于绘制非线性函数曲线的信号数据集;收集某一时刻前的第一信号数据集,通过第一信号数据集的信号增速判断非线性函数曲线存在或不存在扩增分界点,确定所述某一时刻的非线性函数曲线类型;收集某一时刻前的第二信号数据集,通过第二信号数据集的信号同比增速确定对于非线性函数曲线类型匹配的准确度以及是否符合阳性样本特征。本发明通过设置的多级判定方法输出判定结果,可提高等温扩增核酸结果判定的效率和准确性,还能应用于其他反应结果判定,具有较好的应用前景。
  • 基于生物介质的数据存储方法、装置和设备-202310615580.4
  • 林晶昱 - 上海哔哩哔哩科技有限公司
  • 2023-05-29 - 2023-09-19 - G16B30/00
  • 本公开的各实施例的目的是提供一种基于生物介质的数据存储方法、装置和设备。转码装置获取待存储的数据以及生物介质的生物特征序列,将待存储数据与该生物特征序列进行关联映射并存储两者的关联关系。本公开的各实施例提供了一种基于生物介质的数据存储方案,其打破了计算机硬件存储介质的限制,利用生物介质来进行数据存储。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top