[发明专利]寡核苷酸序列中的缺失检测在审

专利信息
申请号: 202180076107.2 申请日: 2021-10-20
公开(公告)号: CN116569265A 公开(公告)日: 2023-08-08
发明(设计)人: T·翁;苏政;M·科恩;B·谷内维格 申请(专利权)人: 吉尼尤斯基因组学股份有限公司
主分类号: G16B40/20 分类号: G16B40/20
代理公司: 中国贸促会专利商标事务所有限公司 11038 代理人: 李程达
地址: 澳大利亚*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要: 本文所公开的是一种用于检测基因序列中的缺失的方法。所述方法包括由处理器接收训练测序数据,所述训练测序数据包括与具有缺失的基因序列和不具有缺失的基因序列相关的多个训练读段。所述处理器将所述多个训练读段中的每一个训练读段分割成比所述训练读段短的多个训练区段,并利用所述多个区段训练机器学习模型。所述处理器接收包括多个测试读段的测试测序数据,将所述多个测试读段中的每一个测试读段分割成多个测试区段,并且针对所述多个测试区段评估经训练的机器学习模型,以检测所述测试测序数据中的缺失。不需要比对或变体识别,这显著降低了评估步骤的计算复杂性。
搜索关键词: 寡核苷酸 序列 中的 缺失 检测
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉尼尤斯基因组学股份有限公司,未经吉尼尤斯基因组学股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202180076107.2/,转载请声明来源钻瓜专利网。

同类专利
  • 寡核苷酸序列中的缺失检测-202180076107.2
  • T·翁;苏政;M·科恩;B·谷内维格 - 吉尼尤斯基因组学股份有限公司
  • 2021-10-20 - 2023-08-08 - G16B40/20
  • 本文所公开的是一种用于检测基因序列中的缺失的方法。所述方法包括由处理器接收训练测序数据,所述训练测序数据包括与具有缺失的基因序列和不具有缺失的基因序列相关的多个训练读段。所述处理器将所述多个训练读段中的每一个训练读段分割成比所述训练读段短的多个训练区段,并利用所述多个区段训练机器学习模型。所述处理器接收包括多个测试读段的测试测序数据,将所述多个测试读段中的每一个测试读段分割成多个测试区段,并且针对所述多个测试区段评估经训练的机器学习模型,以检测所述测试测序数据中的缺失。不需要比对或变体识别,这显著降低了评估步骤的计算复杂性。
  • 检测测序数据中的交叉污染-202180076568.X
  • O·萨卡里亚;C-J·A·V·亚基姆;P·P·辛格;R·A·P·卡列夫;R·黄 - 格瑞尔有限责任公司
  • 2021-09-17 - 2023-06-27 - G16B40/20
  • 检测用于确定受试者癌症的测试样本之间的交叉污染是有益的。为了检测交叉污染,使用基因组测序技术制备包括至少一个单核苷酸多态性的测试序列。可以对一些测试序列进行过滤以提高准确度和精确度。基于次要等位基因频率来确定每个测试序列的先验污染概率。将包括似然测试的污染模型应用于测试序列。似然测试获得表示测试样本受污染的可能性的当前污染概率。污染模型还可以确定样本包括杂合度损失的可能性,该杂合度损失表示测试序列受污染的可能性。受污染的测试样本将被移除。通过将受污染的测试序列与其他测试序列进行比较,可以找到受污染的测试样本的来源。
  • 使用辅助折叠网络预测蛋白质结构-202180069629.X
  • S·科尔;O·罗内伯格;M·非古尔诺夫;A·普里泽尔 - 渊慧科技有限公司
  • 2021-11-23 - 2023-06-23 - G16B40/20
  • 用于训练结构预测神经网络的方法、系统和装置,包括在计算机存储介质上编码的计算机程序,结构预测神经网络包括嵌入神经网络和主折叠神经网络。根据一个方面,一种方法包括:获得表征训练蛋白质的训练网络输入;使用嵌入神经网络和主折叠神经网络处理训练网络输入以生成主结构预测;对于一个或多个辅助折叠神经网络的集合中的每个辅助折叠神经网络,至少处理嵌入神经网络的对应中间输出以生成辅助结构预测;确定目标函数的梯度,目标函数包括关于辅助折叠神经网络中的每一个的相应辅助结构损失项;以及基于梯度更新嵌入网络参数和主折叠参数的当前值。
  • 用于评估药物效力的系统和方法-201880036325.1
  • S·张;M·王;A·怀斯;H·康;V·F·奥努席克;K·克鲁格利亚克 - 伊鲁米那股份有限公司
  • 2018-12-03 - 2023-06-20 - G16B40/20
  • 本发明提供一种计算机实现的方法,包括向经训练的机器学习分类器输入包括来自肿瘤样本的特征的非训练受试者基因组信息,其中所述经训练的机器学习分类器依据从训练受试者获得的肿瘤样本的特征和这些训练受试者对检查点抑制疗法的反应性进行训练,且该机器学习分类器经训练以预测对该治疗的反应性;和采用所述经训练的机器学习分类器,生成预测受试者对检查点抑制作用的反应性的检查点抑制作用反应性分类,并使用图形化用户界面,报告该检查点抑制作用反应性分类。本发明还提供用于实施所述方法的计算机系统和通过所述方法训练的机器学习分类器。
  • 用于从头抗体亲和力成熟(修饰)和特性改进的深度学习-202180052555.9
  • Z·K·科斯特洛;J·费拉;A·L·彼姆 - 旗舰开拓创新六世公司
  • 2021-07-28 - 2023-05-23 - G16B40/20
  • 控制抗体的亲和力和表达是临床应用的关键。高亲和力抗体与更高的特异性相关,并且能够以较低剂量使用。目前,抗体成熟是通过定向进化方法来解决的。在这种情况下,将突变结合物的初始文库接种到过程中,并通过多轮突变和选择来提高亲和力。然而,本披露内容采用了机器学习方法利用与定向进化相似的过程来计算成熟抗体序列。这些抗体序列在其经过计算和验证后可以被制造成物理抗体。另外,本方法在靶向特异性亲和力时有可能优于定向进化,并且适用于一般的蛋白质‑蛋白质相互作用。
  • 诸如用于动物营养管理的微生物组分析-202180058822.3
  • V·L·麦金托什;J·E·德奥利韦拉 - CAN科技公司
  • 2021-05-27 - 2023-05-09 - G16B40/20
  • 一种训练微生物群模型引擎以识别用于预测食品安全或动物生长的生物标志物的方法包括:获得指示对从一组动物的胃肠道获得的候选生物标志物的测定的数据,其中该测定在这些动物的生命周期中以指定间隔执行并且这些动物以这些指定间隔表现指定特性。该方法还包括:使用该数据训练该微生物群模型引擎以基于食品安全或动物生长标准中的至少一者生成预测,并且从所训练的微生物群模型引擎获得由该微生物群模型引擎用来生成该预测的特征集合。该方法另外包括:根据该特征集合从这些候选生物标志物当中识别生物标志物的子集,并且提供该生物标志物的子集以用于生成食品安全或动物生长预测。
  • 用于基于人工智能的碱基检出器的拆分架构-202180015544.3
  • A·杜塔;G·韦瑟尔;D·卡什夫哈吉吉;G·D·帕纳比;K·贾加纳坦;A·起亚 - 因美纳有限公司
  • 2021-02-19 - 2022-12-06 - G16B40/20
  • 本发明所公开的技术涉及包括空间卷积网络和总线网络的系统。该空间卷积网络被配置为通过相应的空间处理流水线分别处理相应的每循环测序图像集来逐个循环地处理每循环测序图像集的窗口,以针对相应的测序循环生成相应的每循环空间特征图集。该总线网络被配置为在该相应的空间处理流水线内的空间卷积层之间形成总线。该总线被配置为使由空间卷积层的特定序列中的两个或更多个空间卷积层针对特定测序循环生成的相应的每循环空间特征图集组合成组合的每循环空间特征图集,并且将该组合的每循环空间特征图集作为输入提供给空间卷积层的特定序列中的另一个空间卷积层。
  • 用于基于人工智能的碱基检出器的总线网络-202180015983.4
  • A·杜塔;G·韦瑟尔;D·卡什夫哈吉吉;G·D·帕纳比;K·贾加纳坦;A·起亚 - 因美纳有限公司
  • 2021-02-19 - 2022-11-25 - G16B40/20
  • 本发明所公开的技术涉及包括空间卷积网络和时间卷积网络的系统。该空间卷积网络被配置为处理每循环测序图像集的窗口并生成相应的每循环空间特征图集。空间卷积滤波器组的相应的序列的空间卷积滤波器组中的空间卷积滤波器的经训练系数在空间卷积层的相应的序列中的空间卷积层的序列之间变化。该时间卷积网络被配置为按组处理该每循环空间特征图集并生成相应的每组时间特征图集。相应的时间卷积滤波器组中的时间卷积滤波器的经训练系数在相应的时间卷积滤波器组中的时间卷积滤波器组之间变化。
  • 用于学习各种生物实体之间的新颖关系的方法和系统-202080099299.4
  • 蒂莫·施泰勒;布兰登·马隆 - NEC实验室欧洲有限公司
  • 2020-04-01 - 2022-11-18 - G16B40/20
  • 一种学习各种实体、特别是比如化学物质、蛋白质和疾病等生物实体之间的新颖关系的计算机实施的方法包括:建立知识图(100),其中,实体中的每个实体表示为节点(110),并且实体之间的每个关系表示为相应节点(110)之间的边(120);以及用一个或多个数据模态的对象(130)来注释知识图(100)中的实体。用该知识图(100)来训练神经网络系统(200),其中,该神经网络系统(200)通过共同学习来自该知识图(100)的节点(110)的嵌入和这些数据模态的相应一个数据模态的对象(130)的嵌入,以统一的方式处理该知识图(100)和这些数据模态的相应一个数据模态的对象(130)。已学习的嵌入用于识别实体之间的新颖关系。
  • 用于基于人工智能的碱基检出的数据压缩-202180015512.3
  • G·韦瑟尔;G·D·帕纳比;A·杜塔;D·卡什夫哈吉吉;K·贾加纳坦;A·起亚 - 因美纳有限公司
  • 2021-02-19 - 2022-11-01 - G16B40/20
  • 本发明所公开的技术涉及基于人工智能的碱基检出方法。具体地,本发明所公开的技术涉及通过基于神经网络的碱基检出器的空间网络处理用于测序运行的测序循环的第一窗口的每循环分析物通道集的第一窗口,并且针对测序循环的该第一窗口中的相应的测序循环生成空间输出集的相应的序列;通过基于神经网络的碱基检出器的压缩网络处理空间输出集的该相应的序列中的相应的最终的空间输出集,并且针对测序循环的该第一窗口中的该相应的测序循环生成相应的压缩的空间输出集;并且基于该相应的压缩的空间输出集,针对测序循环的该第一窗口中的一个或多个测序循环生成碱基检出预测。
  • 基因选择方法以及装置-202180017891.X
  • 郑起弘;洪佑宗;金瑜真;纳利尼钱德兰·阿尼尔库马尔 - 庆熙大学校产学协力团
  • 2021-02-02 - 2022-11-01 - G16B40/20
  • 本发明公开一种基因选择方法。为此,本发明包括:获取步骤,基于与对象的多个基因相关的蛋白质序列,获取系统发生树图以及基因的表达量数据;相关关系确定步骤,随着以查询输入的特定基因包含于在上述系统发生树图中共享同域的多个基因,对上述特定基因与上述系统发生树图内的多个基因分别比较相互之间的表达模式,来确定相关关系;靶基因确定步骤,基于对上述特定基因所确定的相关关系,在上述对象的多个基因中确定功能与上述特定基因重复的靶基因;以及提供步骤,提供与所确定的上述靶基因相关的信息。
  • 用于分析电子图像以进行质量控制的系统和方法-202080098085.5
  • J·苏伊;R·尤斯菲;P·许夫勒;T·富赫斯;L·格拉迪 - 佩治人工智能公司
  • 2020-12-18 - 2022-10-18 - G16B40/20
  • 公开了系统和方法,用于接收对应于与病理学类别相关联的目标样本的数字图像;确定质量控制(QC)机器学习模型以基于一个或多个伪影来预测质量指定;提供数字图像作为QC机器学习模型的输入;接收数字图像的质量指定作为来自机器学习模型的输出;以及输出数字图像的质量指定。质量保证(QA)机器学习模型可以基于一个或多个生物标志物来预测疾病指定。该数字图像可以被提供给QA模型,该QA模型可以输出疾病指定。可以将外部指定与疾病指定进行比较,并且可以输出比较结果。
  • 利用起源组织阈值的癌症分类-202080086135.8
  • 刘勤文;O·C·维恩;S·S·格罗斯;R·A·P·卡列夫 - 格瑞尔有限责任公司
  • 2020-10-09 - 2022-08-05 - G16B40/20
  • 公开了用于检测癌症和/或确定癌症起源组织的方法和系统。在一些实施例中,公开了一种多类癌症分类器,其用包含cfDNA片段的多个生物样本进行训练。分析系统得到每个样本的特征向量,并且多类分类器预测多个起源组织(TOO)类别中的每个起源组织的概率似然性。在一些实施例中,多个TOO类别包括血液亚类,包括血液恶性肿瘤和前体病症两者。在一个实施例中,具有高组织信号的非癌症样本从训练样本集中被剪除。在另一实施例中,分析系统根据组织信号对样本进行分层,并应用为每个层确定的二元截断阈值。
  • 用于训练机器学习算法以处理生物学相关数据的系统和方法、显微镜及经训练的机器学习算法-201980099039.4
  • C·卡佩尔 - 徕卡显微系统CMS有限公司
  • 2019-06-07 - 2022-05-06 - G16B40/20
  • 系统(100)包括一个或多个处理器(110)和一个或多个存储设备(120),其中系统(100)配置为通过由一个或多个处理器(110)执行的语言识别机器学习算法生成基于生物学相关语言的输入训练数据(102)的第一高维表示。此外,系统(100)配置为通过语言识别机器学习算法根据第一高维表示生成基于生物学相关语言的输出训练数据,根据基于生物学相关语言的输入训练数据(102)和基于生物学相关语言的输出训练数据的比较调整语言识别机器学习算法。此外,系统(100)配置为通过由一个或多个处理器(110)执行的视觉识别机器学习算法生成基于生物学相关图像的输入训练数据(104)的第二高维表示,根据第一高维表示和第二高维表示的比较调整视觉识别机器学习算法。
  • 用于癌症基因组和临床数据综合分析的多组学搜索引擎-201980080958.7
  • A·哈雷;E·辛布洛特;C·劳 - 人类长寿公司
  • 2019-10-14 - 2021-08-06 - G16B40/20
  • 提供了利用多组学数据索引来进行肿瘤概况分析的方法。方法可以包括存储多个多组学数据索引,其中多个多组学数据索引中的每一个包括癌症特定的记号化数据;摄取附加的多组学数据以及与附加的多组学数据相关联的任何注释,附加的多组学数据与一个或多个索引有关;对所摄取的附加多组学数据和注释进行索引,同时在特定索引中保留基因名称、基因变体名称和针对同一患者的不同数据流之间的多组学映射,以产生经记号化的所摄取的附加多组学数据;接收用户查询;基于用户查询来选择一个或多个相关多组学数据索引;基于临床可操作性、致病性、特征权重或频率中的至少一项,将所选择的一个或多个多组学数据索引排名;以及向用户返回经排名的一个或多个多组学数据索引。
  • 用于预测受试物质在人类中作用的人工智能模型-201980043930.6
  • 佐藤匠德 - 无限生物制药公司
  • 2019-05-31 - 2021-02-12 - G16B40/20
  • 一种用于训练人工智能模型的方法,其包括通过将第一训练数据组与第二训练数据或第二训练数据组输入到人工智能模型来训练人工智能模型,其中第一训练数据组包含指示一个器官或多个不同器官中的每一个中一种以上的生物标志物的动力学的数据的组,该一个或多个不同器官收集自已经施用多种在人类中具有已知作用的现有物质的各非人类动物,并且第二训练数据包含与从施用于非人类动物的多种现有物质中获得的人类中已知作用有关的信息,其中所述人工智能模型从指示已经施用受试物质的非人类动物中的一个器官或多个不同器官中的每一个中的一种以上的生物标志物的动力学的数据的组预测受试物质在人类中的一种以上的作用,该一个器官或多个不同器官分别对应于在生成第一数据组时收集的一个器官或多个器官,并且所述人工智能模型使用利用所述训练方法训练的人工智能模型预测受试物质的效果和副作用等作用。
  • 用于识别引起序列特异性错误(SSE)的序列图案的基于深度学习的框架-201980003258.8
  • D·卡什夫哈吉;A·起亚;K-H·法尔 - 因美纳有限公司
  • 2019-07-09 - 2020-03-17 - G16B40/20
  • 所公开的技术提出一种识别引起序列特异性错误(SSE)的序列图案的基于深度学习的框架。系统和方法以大规模变体数据训练变体滤波器以学习序列图案和虚假变体识别之间的因果相关性。所述变体滤波器具有分层结构,所述分层结构构建于深度神经网络上,诸如卷积神经网络和全连接神经网络。系统和方法实施模拟,所述模拟利用所述变体滤波器来测试已知序列图案对于变体滤波的影响。所述模拟的前提如下:当将一对待测重复图案和识别的变体馈送至所述变体滤波器作为模拟输入序列的一部分并且所述变体滤波器将识别的变体分类为虚假变体识别时,那么所述重复图案视为已引起所述虚假变体识别并且识别为SSE起因。
  • 用于训练深层卷积神经网络集合的半监督学习-201880043830.9
  • L·孙达拉姆;K-H·法尔;H·高;J·F·麦克雷 - 因美纳有限公司
  • 2018-10-15 - 2020-03-06 - G16B40/20
  • 公开的技术涉及构建用于变体分类的基于卷积神经网络的分类器。更具体地,涉及使用基于后向传播梯度更新方法在训练数据上训练基于卷积神经网络的分类器,该方法逐步地将基于卷积网络网络的分类器的输出与相应的真实值标签匹配。该基于卷积神经网络的分类器包括残差块组,每个残差块组由残差块中的卷积滤波器数量、残差块的卷积窗口尺寸和残差块的空洞卷积率参数化,所述卷积窗口尺寸在残差块组之间变化,所述空洞卷积率在残差块组之间变化。所述训练数据包括从良性变体和致病性变体产生的转译序列对的良性训练实例和致病性训练实例。
  • 基于深度神经网络的变体分类器-201980003278.5
  • A·怀斯;K·M·克鲁雅克 - 因美纳有限公司
  • 2019-04-12 - 2020-02-21 - G16B40/20
  • 我们介绍了一种使用深度神经网络预测给定变体是否为体细胞变体或种系变体的变体分类器。所述模型具有两个深度神经网络:一个卷积神经网络(CNN)和一个全连接神经网络(FCNN)以及两个输入:一个具有变体的DNA序列和一组与变体相关的元数据特征。元数据特征表示变体的突变特征、读长映射统计资料及发生频率。CNN处理DNA序列并生成中间卷积特征。特征序列来源于将元数据特征与中间卷积特征进行连接。FCNN处理特征序列并产生变体为体细胞变体、种系变体或噪声变体的概率。迁移学习策略用于在两个突变数据集上对模型进行训练。结果确立了基于传统分类器的模型的优势和优越性。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top