[发明专利]用于对未知重要性的变体划分优先级顺序的系统和方法有效
申请号: | 201680044272.9 | 申请日: | 2016-07-26 |
公开(公告)号: | CN107851136B | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | V·阿格拉瓦尔;N·迪米特罗娃 | 申请(专利权)人: | 皇家飞利浦有限公司 |
主分类号: | G16B20/50 | 分类号: | G16B20/50 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 孟杰雄;王英 |
地址: | 荷兰艾*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 未知 重要性 变体 划分 优先级 顺序 系统 方法 | ||
本公开内容描述了用于基于基因的变体对疾病的潜在重要性来生成针对所述基因的所述变体的优先级评分的系统和方法。可以针对多个变体计算优先级评分,并且可以基于所生成的优先级评分对所述变体进行排序。
背景技术
全世界基因组学研究面临的一个主要挑战是确定如何分析下一代测序机提供的大量数据。处理数据并将其翻译成能够用于疾病诊断和治疗的临床相关信息是具有挑战性的。仍未能在整体上完全理解基因组。一个挑战是确定未知重要性的变体的影响。
基因序列可能存在几个、上百个或者甚至上千个变体。这些变体的显著部分可能对基因的功能或表达没有影响。然而,这些变体中的一些可能对诸如癌症的疾病状态有影响。这些变体可能对于确定哪些治疗对于处置特定疾病(例如,表现出特定变体的肿瘤可能比没有该变体的肿瘤对药物更为敏感)和/或对于寻找针对新的治疗的目标可能有效是有用的。确定哪些变体可能对研究和/或处置有用以及哪些变体不具有重要影响仍然是一个挑战。
已经开发了各种算法来预测变体的功能影响。每种算法都用其自己的评分将各种变体归类到各种种类中,例如,良性、有害、潜在有害、可容忍等。这些算法中的每种算法都用其度量将各种变体分类到上述类别中。但是,这些算法的结果是有差异的。
发明内容
根据本公开内容的实施例的范例方法可以包括:接收来自存储器的基因序列,所述基因序列可以包括基因的多个变体;接收针对所述基因的第一变体的多个致病性评分,其中,所述多个致病性评分中的每个可以指示所述第一变体的可能的致病性;利用至少一个处理器计算在被存储在所述至少一个处理器能访问的数据库中的疾病数据集中所述第一变体的流行率;利用所述至少一个处理器计算在被存储在所述数据库中的健康群体数据集中所述第一变体的流行率;利用所述至少一个处理器计算在被存储在所述数据库中的所述疾病数据集中针对所述基因的突变率;利用所述至少一个处理器计算在被存储在所述数据库中的所述健康群体数据集中针对所述基因的突变率;利用所述至少一个处理器计算所述第一变体的接合子型式,其中,所述接合子型式至少部分地基于所述第一变体是纯合的还是杂合的;至少部分地基于以下的组合来生成针对所述第一变体的优先级评分:所述多个致病性评分、在所述疾病数据集中所述第一变体的所计算出的流行率和在所述健康群体数据集中所述第一变体的所计算出的流行率、在所述疾病数据集中针对所述基因的所计算出的突变率和在所述健康群体数据集中针对所述基因的所计算出突变率,以及所述第一变体的所计算出的接合子型式,其中,所述优先级评分指示所述变体对所述疾病的重要性;生成针对所述基因的剩余的多个变体中的每个的所述优先级评分;基于每个变体的生成的优先级评分对所述第一变体和多个额外的变体进行排序,其中,较高的变体排序指示所述变体对疾病的较高重要性;并且向用户提供所述变体排序和相关联的优先级评分。
根据本公开内容的实施例的范例系统可以包括:处理器;所述处理器能访问的存储器,所述存储器可以被配置为存储数字形式的基因序列,其中,所述基因序列可以包括基因的多个变体;所述处理器能访问的数据库;以及被耦合到所述处理器的显示器,其中,所述处理器可以被配置为:接收来自所述存储器的所述基因序列;计算针对所述基因的第一变体的多个致病性评分,其中,高致病性评分可以指示所述第一变体的致病性的较高可能性;至少部分地基于在被存储在所述数据库中的疾病中针对所述基因的突变率来计算针对所述基因的疾病基因突变评分,其中,高疾病基因突变评分可以指示所述基因对疾病的重要性的较高可能性;至少部分地基于在被存储在所述数据库中的所述疾病中所述第一变体的频率来计算针对所述第一变体的疾病频率评分,其中,高疾病频率评分可以指示所述第一变体对所述疾病的重要性的较高可能性;至少部分地基于在被存储在所述数据库中的健康群体中所述第一变体的频率来计算针对所述第一变体的健康频率评分,其中,高健康频率评分可以指示所述变体对所述疾病的重要性的较低可能性;至少部分地基于在被存储在所述数据库中的所述健康群体中针对所述基因的比率来计算针对所述基因的健康基因突变评分,其中,高健康基因突变评分可以指示所述基因对所述疾病的重要性的较低可能性;计算所述第一变体的接合子型式,其中,所述接合子型式至少部分地基于所述第一变体是纯合的还是杂合的;将所述多个致病性评分、所计算出的疾病基因突变评分、所计算出的疾病频率评分、所计算出的健康频率评分、所计算出的健康基因突变评分以及所述第一变体的所计算出的接合子型式组合在一起以产生针对所述第一变体的优先级评分,其中,所述优先级评分指示所述基因的所述变体对所述疾病的重要性;生成针对所述基因的剩余的多个变体中的每个的所述优先级评分;基于每个变体的生成的优先级评分对所述第一变体和所述剩余的多个变体进行排序,其中,较高的变体排序指示所述变体对疾病的较高重要性;并且向所述显示器提供所述变体排序和相关联的优先级评分。
附图说明
图1是根据本公开内容的实施例的基因序列的图。
图2是根据本公开内容的实施例的系统的功能框图。
图3是根据本公开内容的实施例的方法的流程图。
具体实施方式
某些示范性实施例的以下描述实际上仅仅是示范性的,并且决不旨在限制本发明或其应用或用途。在本系统和方法的实施例的以下详细描述中,参考作为其部分的附图,并且通过图示的方式示出了可以实践所述系统和方法的特定实施例。这些实施例被足够详细地描述以使得本领域技术人员能够实践当前公开的系统和方法,并且应当理解,在不脱离本系统的精神和范围的情况下,可以使用其他实施例,并且可以进行结构和逻辑上的改变。
因此,下面的详细描述不应被认为是限制性的,并且本系统的范围仅由权利要求来限定。本文中的附图中的附图标记的(一个或多个)前导数字通常对应于附图编号,除了以相同的附图标记来标识出现在多个附图中的相同部件。此外,出于清楚的目的,当对于本领域技术人员来说明显时,将不讨论某些特征的详细描述,以免使对本系统的描述难以理解。
本文描述了将通常高度不一致的各种变体致病性评分进行整合的范例方法和系统。本文描述的评分方案可以提供更稳健和/或可靠的评分,其可以用于以与常规评分算法相比更高的灵敏度和特异性对未知重要性的变体划分优先级顺序。
可以通过消除在健康群体中也是高度流行的变体而使用跨健康群体和受疾病影响的群体的变体的流行率来使变体与致病性相关联。添加群体水平信息可以消除或减少可能被常规评分算法预测为有害、但也在健康群体中频繁发现的变体的假阳性。
存在高度可变的基因,即,它们具有比其他基因更高的突变率。高度可变基因的变体可能比具有较低突变率的基因的变体较不显著。针对基因的背景突变率可以用于降低针对在高度可变基因中发现的变体的致病性评分。
本文描述的方法和系统可以包括综合评分方法,以通过将当前使用的功能预测算法与对预测特定变体的致病性重要的因素一起进行整合来产生针对未知重要性的变体的优先级评分。例如,诸如SIFT、Polyphen、LRT以及突变审阅器的算法具有各种评分标准和方法,并且可以用于生成可以用于产生针对变体的最终优先级评分的一个或多个评分。
通过本文描述的方法和系统计算出的针对变体的优先级评分可以用于对一个或多个基因的变体划分优先级顺序。优先级评分可以基于多个度量,所述多个度量可以减少反映变体对于疾病是致病的和/或重要的概率的冲突评分。
图1是根据本公开内容的实施例的基因序列100的图。基因序列100可以是针对基因、多个基因或基因的部分的序列。基因序列100可以包括基因的变体105。变体105可以是点突变或者可以包括多个碱基对。变体105可以被包括在序列100的外显子组110部分中。外显子组110可以对一个或多个氨基酸进行编码。基因序列100还可以包括一个或多个内含子115部分。在一些实施例中,可以选择基因序列100以排除一个或多个内含子115部分。
基因中的变体105可以使一个或多个氨基酸被替代氨基酸所替换和/或从由基因序列100的该部分合成的蛋白质中去除。由该基因编码的氨基酸因变体105造成的变化可能会影响一种或多种蛋白质的功能和/或结构。这种变体可能会导致一种或多种蛋白质过度表达或表达不足。这些影响可能是有害的,有助于变体105的致病性。例如,p53基因的变体可以中止产生蛋白质或导致产生负责使突变细胞停止分裂的畸形蛋白质。在没有活性形式的蛋白质的情况下,突变的细胞可能分裂并形成肿瘤。
如果变体105及其影响与特定疾病(例如,癌症、自身免疫性疾病)高度相关联,则变体105可以用于选择靶向治疗和/或选择用于临床研究的候选者。然而,许多变体几乎没有影响。许多变体可能不是特定于疾病或其他条件。一个基因可能有数以千计的变体,但是只有一小部分可能是潜在临床相关的(例如,具有致病影响)。先前存在的算法(例如,SIFT和Polyphen)试图预测变体的致病性并指定致病性评分。然而,这些算法可能提供相互矛盾的结果,并且对变体的致病性过分预测或预测不足。系统或用户可能难以确定哪些变体是最重要的。可以考虑可以对用于确定变体的致病性并对多个变体划分优先级顺序的先前存在的算法进行改进的额外因素。
图2是根据本公开内容的实施例的系统200的功能框图。系统200可以用于生成针对变体的优先级评分,所述优先级评分可以是变体对疾病和/或其他状况的重要性的度量。数字形式的基因序列(例如,图1中示出的基因序列100)可以被包括在存储器205中。处理器215可以访问存储器205。处理器215可以包括一个或多个处理器。处理器215可以访问包括一个或多个数据集(例如,癌症基因组图谱(TCGA))的数据库210。在一些实施例中,数据库210可以包括一个或多个数据库。处理器215可以提供其计算结果。例如,可以将结果提供给显示器220和/或数据库210。显示器220可以是对用户可见的电子显示器。在一些实施例中,系统还可以包括其他设备以提供结果,例如,打印机。任选地,处理器215还可以访问计算机系统225。计算机系统225可以包括额外的数据库、存储器和/或处理器。计算机系统225可以是系统200的部分或由系统200远程访问。在一些实施例中,系统200还可以包括基因测序设备230。基因测序设备230可以处理生物样本(例如,肿瘤活检,面颊擦拭的基因隔离)以生成基因序列并产生数字形式的基因序列。
处理器215可以被配置为计算被存储在一个或多个数据集中的一个或多个群体中的变体的流行率,所述一个或多个数据集可以被存储在数据库210中。处理器215可以被配置为计算被存储在一个或多个数据集中的一个或多个群体中的基因的突变率,所述一个或多个数据集可以被存储在数据库210中。处理器215可以被配置为至少部分地基于计算出的流行率、突变率和/或接收到的致病性评分来生成优先级评分。在一些实施例中,处理器215可以被配置为组合一个或多个致病性评分以生成优先级评分。在一些实施例中,处理器215可以被配置为确定变体的接合子型式。处理器215可以被配置为向显示器220、数据库210、存储器205和/或计算机系统225提供优先级评分。在一些实施例中,当处理器215包括超过一个的处理器时,处理器可以被配置为执行不同的计算以确定优先级评分和/或并行执行计算。
在一些实施例中,处理器215可以被配置为计算针对超过一个的变体的优先级评分。在这些实施例中,处理器215可以被配置为至少部分地基于每个变体的优先级评分对变体进行排序。在一些实施例中,可以将存储器205中的一个或多个基因序列添加到数据库210中。可以将基因序列添加到数据库210中的一个或多个数据集并用于动态更新对优先级评分的计算、对变体的排序和/或用于随后计算变体的优先级评分。
在一些实施例中,处理器215可以被配置为将Dempster-Shafer理论应用于上述的致病性评分和其他计算以生成针对变体的优先级评分。
系统200可以通过改进变体的优先级顺序来允许更快地确定对于疾病或其他状况最重要的变体。这可以引起更快地分析最重要变体(例如,蛋白质折叠分析,基因表达)。现有系统为变体的重要性提供了高百分比的假阳性,需要大量额外的计算和/或耗时的审查,这降低了确定最重要的变体的能力。确定最重要的变体可以允许系统200、其他系统和/或用户基于最重要的变体来做出处置和/或研究决策。系统200可以用在研究实验室、医院和/或其他环境中。用户可以是疾病研究者、医生和/或其他临床医师。
图3是根据本公开内容的实施例的用于生成针对变体的优先级评分的方法300的流程图。在一些实施例中,方法300可以由诸如图2中示出的系统200的系统来执行。可以在框305处接收针对变体的基因序列。基因序列可以是数字形式的并且被提供给存储器。基因序列可以由下一代测序设备或其他来源(例如,数据库、便携式硬盘驱动器、互联网)来提供。可以在框310处接收针对变体的一个或多个致病性评分。可以使用已知的算法(例如,SIFT、Polyphen、LRT、突变审阅器和/或其他算法)来计算致病性评分。在一些实施例中,当接收到超过一个的致病性评分时,可以将评分组合成单个致病性评分(例如,平均、归一化和相加,或归一化和相乘)。
在框315处,可以计算疾病中的变体的流行率。流行率可以通过以下来计算:其中存在该变体的疾病实例的百分比、基因序列的样本中该变体的实例的总数和/或其他方法。可以通过确定疾病的基因序列的数据集中该变体出现的频率来计算流行率。在框320处,可以计算健康群体中的该变体的流行率。可以以与对疾病中该变体流行率的类似的方式计算在健康群体中该变体的流行率。例如,可以由其中健康群体中存在该变体的实例的百分比和/或来自健康群体的基因序列的样本中该变体的实例的总数来确定流行率。
针对一个或多个基因的序列的数据集可以用于确定在一个或多个群体中变体的流行率。群体可以是个体(例如,人、小鼠)或细胞(例如,肝、HeLa)的群体。尽管在图3中未示出,但是可以分析额外的群体和/或亚群体(例如,多个物种、人种、性别)。在疾病中的该变体与在健康群体中的该变体的流行率相比的相对流行率越大,该变体对疾病可能越重要。癌症基因组图谱(TCGA)是序列的数据集的范例。TCGA可以用作针对疾病群体的数据集。序列的数据集的另一范例是千人基因组计划。该数据集可以用于健康群体。也可以使用其他数据集。
数据集也可以用于确定基因中的突变的流行率。基因中的突变的流行率可以对应于该基因的突变率。在框325处,计算包括变体的基因的突变率,然后在框330处计算健康群体中包含该变体的基因的突变率。可以使用替换率、突变累积线、系统发育方法和/或其他方法来计算突变率。在疾病中的该基因与在健康群体中的该基因的突变率相比的相对突变率越大,该基因中的突变对疾病可能越重要。在健康群体和疾病群体两者中都具有低突变率的基因中的突变可能比在健康群体和疾病群体两者中都具有高突变率的基因中的突变更加重要。
框315-330中的计算出的变体的流行率以及突变率可以用于修改在框310出计算出的致病性评分。可以在框335处生成优先级评分。优先级评分可以是通过变体流行率和突变率调整的致病性评分。这些调整可以减少由先前存在的算法计算出的致病性的过分估计和/或估计不足。然后可以在框340处将优先级评分提供给用户。可以将针对该变体的优先级评分提供给数字显示器,打印输出设备、非瞬态计算机可读介质和/或其他设备。
可以对一个或多个基因的多个变体执行方法300。然后可以基于它们的优先级评分对变体进行排序。优先级评分越高,变体对疾病可能越重要。例如,可以将变体及其相关联的优先级评分作为列表提供给用户。该列表可以被排列顺序和/或排序,其中具有最高优先级评分的变体在列表顶部。这可以允许用户快速确定哪些变体可能最重要。在一些实施例中,只有具有高于期望的阈值评分的优先级评分的那些变体可以被提供给用户。用户可以基于变体的优先级评分来选择治疗和/或用于临床试验的候选者。
在一些范例中,可以将最高排序的变体中的一个或多个提供给诸如图2中示出的处理器215的处理器。处理器可以至少部分地基于优先级评分来确定蛋白质表达的变化。临床医师可以使用蛋白质表达的变化来选择治疗、对用于药物发现的目标划分优先级顺序和/或进行其他应用。
可以考虑额外的因素来改进致病性评分。在一些实施例中,可以分析变体的接合子型式。杂合变体可以修改致病性评分以生成较低的优先级评分或可以不修改致病性评分。纯合变体可以修改致病性评分以生成较高的优先级评分。也就是说,纯合变体(变体出现在染色体的两个拷贝中)对于疾病来说可能比杂合变体更为重要。在一些实施例中,如果变体是纯合的,则变体的接合子型式可以是2,如果变体是杂合的,则变体的接合子型式可以是1。
在一些实施例中,如上面简要描述的,可以计算亚群体(例如,种系数据集和/或功能域数据集)中变体的流行率,以修改致病性评分来生成优先级评分。例如,对于种系数据集,在中国群体中罕见的变体可能对于中国患者中的疾病更为重要,但对欧洲群体(其中该变体在健康的欧洲人中更为频繁地出现)中的疾病可能不那么重要。在另一范例中,可以计算诸如癌症特异性功能域的功能域中变体的流行率。
根据本公开内容的实施例的用于计算优先级评分的示范性公式为:
其中:
Dp是归一化的polyphen致病性评分
Ds:归一化的sift致病性评分
Dm:归一化的突变审阅器致病性评分
Dl:归一化的LRT致病性评分
Hh:接合子型式评分
Gtcga:TCGA中该基因内的突变的频率
Vtcga:TCGA内该变体的频率
V1kg:千人基因组计划群体内该变体的频率
跨所有群体在1KG中该基因内的突变的频率
单个群体水平的突变水平下的频率(如果针对该患者的原始群体已知)
Dom1kg:种系中功能域内的突变的频率
DomTCGA:功能域内的突变的频率
公式(1)中示出的范例是宽容优先级评分计算。当期望大量的变体用于审查时,公式(1)可以是有利的。公式(1)以加法环境考虑了来自致病性评分算法的评分,并且可以生成针对变体的较多的高优先级评分。
根据本公开内容的实施例的用于计算优先级评分的第二示范性公式是:
变量定义与针对公式(1)提供的那些相同。公式(2)是惩罚优先级评分计算。当期望少量的变体用于审查时,该公式可以是有利的。公式(2)以乘法背景考虑了来自致病性评分算法的评分,并且可以生成针对变体的较少的高优先级评分。
公式(1)和(2)被提供为说明性、非限制性范例。其他优先级评分计算也是可能的。例如,公式(1)或(2)可以包括更多或更少的致病性评分。
在备选实施例中,可以使用Dempster-Shafer理论将致病性评分、流行率和突变率组合成优先级评分。Dempster-Shafer理论结合了来自不同来源的证据,并导出由可信度函数表示的可信程度,其可以用作优先级评分。可以使用生成优先级评分的其他方法。
尽管说明书描述了用于确定对疾病最重要的变体的方法和系统,但是其他应用也是可能的。例如,可以确定对于抗病性、物理特性、生物相容性、过敏性反应和/或其他性状最重要的变体。
当然,应该意识到,根据本系统、设备和方法的上述实施例或过程中的任一个可以与一个或多个其他实施例和/或过程进行组合或者分离和/或在单独的设备或设备部分之中执行。
最后,上述讨论仅仅旨在说明本系统,不应将其解释为将权利要求限制到任何特定实施例或实施例组。因此,虽然已经参考示范性实施例特别详细地描述了本系统,但是也应该意识到,本领域普通技术人员可以设计出众多修改和替代实施例,而不偏离如在权利要求中所阐述的本系统的更广泛的和想要的精神和范围。因此,说明书和附图应被认为是说明性的,而不是要限制权利要求书的范围。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于皇家飞利浦有限公司,未经皇家飞利浦有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680044272.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:摄像装置
- 下一篇:一种便于拆装的智能摄像头
- 同类专利
- 基因数据处理方法、装置、计算机设备和存储介质-202210195663.8
- 董筱微;张恒;柳文进 - 至本医疗科技(上海)有限公司;上海至本医学检验所有限公司
- 2022-03-01 - 2022-07-01 - G16B20/50
- 本申请涉及一种基因数据处理方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取待处理基因数据;对所述待处理基因数据进行提取,得到所述获取待处理基因数据的纯合突变位点的信息;获取预先设置的筛选条件,根据所述筛选条件以及所述纯合突变位点的信息在所述待处理基因数据中筛选疑似污染位点;根据所述疑似污染位点计算所述待处理基因数据的污染率。采用本方法能够准确计算污染率,提高检测结果的可靠性。
- 一种基于NGS平台的单样本肿瘤体细胞突变判别及TMB检测方法-202210605149.7
- 叶雷;邓望龙;雷燕萍;秦勇;卜范峰;李诗濛;任用 - 江苏先声医疗器械有限公司
- 2022-05-31 - 2022-07-01 - G16B20/50
- 本申请涉及生信分析技术领域,具体提供一种基于NGS平台的单样本肿瘤体细胞突变判别方法及相应TMB检测方法,本方法基于NGS平台数据得到的变异检测结果,通过公共数据库和自建国人突变数据库比对,并基于单样本计算的等位基因拷贝数构建统计分布模型的方法,进行单样本肿瘤体细胞突变的判别,以此实现TMB计算。
- 基于MK-test的群体基因组潜在重要基因筛选的方法-201811317063.4
- 章成君;金桂花;石勇;胡彦婷;李玲 - 中国科学院昆明植物研究所海盐工程技术中心
- 2018-11-07 - 2022-06-28 - G16B20/50
- 本发明提供基于MK‑test的群体基因组潜在重要基因筛选的方法,属于基因筛选技术领域,包括:1)构建基因相互作用网络;2)采用处理模块获取和/或按需输入基因参数;3)将所述的基因参数通过规范公式运算后输出物种间和/或物种内变异率,筛选出群体基因组潜在重要基因;4)将所述的潜在重要基因进行功能性分析;其中处理模块包括至少两基因芯片,与基因芯片连接的计算机。本发明可大批量同时对物种间或物种内存在的差异性分析,运算后可以有效地分析非表达段比例和/或表达段比例随基因的变化而改变的趋势,为群体基因组潜在重要基因筛选提供一条有效的途径。
- 一种融合了单细胞TCR测序数据的肿瘤新生抗原筛选方法-202110443345.4
- 蒋庆华;许召春;王平平;周文洋 - 哈尔滨工业大学
- 2021-04-23 - 2022-06-14 - G16B20/50
- 本发明公开了一种融合了单细胞TCR测序数据的肿瘤新生抗原筛选方法,包括:基于全外显子测序数据及转录组测序数据通过软件进行质控、比对等步骤获取新生突变肽库;使用HLA分型预测软件预测HLA‑I类分型;结合单细胞TCR测序及单细胞转录组测序,通过细胞类型注释、克隆频率分析寻找癌症特异性的CD8+T细胞受体;同时,基于集成深度学习通过peptide‑TCR相互作用预测模型鉴定短肽免疫原性,提出融合单细胞TCR测序数据的肿瘤新生抗原筛选方法,解决了传统肿瘤抗原筛选方法新生抗原错选漏选率高、免疫原性不足等问题。
- 一种基于碱基突变影响mRNA剪接的预测方法、系统及平台-202111385652.8
- 高翠;王伦基;陈汕;韩蓝青 - 赛业(广州)生物科技有限公司
- 2021-11-22 - 2022-06-10 - G16B20/50
- 本发明属于碱基突变剪接技术领域,具体涉及一种基于碱基突变影响mRNA剪接的预测方法、系统及平台。通过一种基于碱基突变影响mRNA剪接的预测方法:获取碱基突变数据信息,并对所述碱基突变数据信息实时转换处理;构建AI模型,通过所述AI模型对突变前后的序列进行剪切预测,并实时生成剪接模型预测数据;实时对所述预测数据进行分析处理,并可视化展示分析处理最终数据,以及相应地系统、平台,能预测碱基突变带来的转录本切割的改变,通过AI模型预测剪切位置再通过分析可能的剪切方式和转录产物,可视化展示,操作方便,速度迅速,结果简单易理解,同时也为研究人员提供一种工具去探究此类突变的致病根本原因等相关研究。
- 一种基于基因组稀有突变负荷变化和基因功能关联发现分子标志物的方法及系统-202111524486.5
- 王涛;刘丽秋;孙中生 - 中国科学院动物研究所
- 2021-12-14 - 2022-06-10 - G16B20/50
- 本发明公开了一种基于基因组稀有突变负荷变化和基因功能关联发现分子标志物的方法及系统,该方法包括:公共稀有突变数据、拷贝数变异数据和感兴趣的基因集的收集和整理;突变贡献度分析;突变负荷分析;基因贡献度分析;正向贡献基因筛选与分析;候选标志物筛选。本发明充分考虑了多种遗传突变类型对疾病的贡献强度,并利用了脑表达及蛋白互作基因之间的内在关联,标志物发现的过程经历了多种不同类型数据的相互支持,鉴定的标志物更加全面。
- 一种筛查结直肠癌术后微小残留病灶及预测复发风险的循环肿瘤DNA检测系统及应用-202110469995.6
- 徐瑞华;王峰;陈功;邵阳 - 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所)
- 2021-04-28 - 2022-06-07 - G16B20/50
- 本发明涉及一种筛查结直肠癌患者术后微小残留病灶的存在、预测复发风险的循环肿瘤DNA检测系统。该检测系统包括结直肠癌组织基因突变筛查模块、血浆游离DNA基因突变分析模块和循环肿瘤DNA状态判断模块。该系统利用同样的下一代测序基因组合面板对原发肿瘤组织和血浆游离DNA进行检测,并考虑患者原发肿瘤组织中检测到的所有突变,而不是局限于个别基因突变,更加全面。该系统可应用于对循环肿瘤DNA的动态、实时监测,可用于评估结直肠癌根治术后微小残留病灶的残留情况,预测复发风险并指导术后治疗决策。
- 一种鉴定体细胞突变的综合策略-201711355434.3
- 张仕坚;严建龙 - 普瑞基准生物医药(苏州)有限公司
- 2017-12-16 - 2022-06-07 - G16B20/50
- 本发明公开了一种鉴定体细胞突变的综合策略,以比对结果作为基础数据,使用SNV鉴定工具组和Indel鉴定工具组同时对基础数据进行SNV和Indel鉴定,使用SNV鉴定工具组得到的所有SNV数据与设定的条件进行对比过滤,取出符合条件的可靠SNV数据,使用Indel鉴定工具组得到的所有Indel数据与设定的条件进行对比过滤,取出符合条件的可靠Indel数据,将可靠SNV数据与可靠Indel数据组合得到可靠体细胞突变结果。本发明综合运用多个突变鉴定工具同时降低鉴定突变时的假阳性和假阴性实现体细胞突变的精确鉴定,将鉴定体细胞突变的综合策略运用到工具中用于生产,应用价值高。
- 一种血液恶性肿瘤的筛查方法和系统-202210214497.1
- 季凯;王正 - 季凯;王正
- 2022-03-07 - 2022-05-27 - G16B20/50
- 本发明公开一种血液恶性肿瘤的筛查方法和系统,属于医疗数据处理领域。其特征在于,包括:数据获取模块,其用于获取血常规检验数据,通过识别血常规化验单图片或直接从电子数据中导入;模型构建模块,通过对健康人群、常见疾病人群、非血液系统恶性肿瘤人群和血液恶性肿瘤人群建立样本,并利用机器学习算法得到筛查模型;筛查模块,利用筛查模型检查血液恶性肿瘤。本发明利用血常规筛查血液恶性肿瘤,特别改进了其他非血液恶性肿瘤疾病的干扰,创新了血液恶性肿瘤筛查方式。
- 一种用于淋巴瘤预后判断的方法、试剂盒及应用-202010090278.8
- 赵维莅;许彭鹏;付迪;王黎;俞浩;刘以哲;熊慧 - 上海交通大学医学院附属瑞金医院;上海源奇生物医药科技有限公司
- 2020-02-13 - 2022-05-20 - G16B20/50
- 本发明涉及基因突变检测领域,具体讲,涉及一种用于淋巴瘤预后判断的方法、试剂盒及应用。本发明通过数据分析计算IPI分型为中高危患者的预后风险值,协助区分高危与低危风险人群,能有效地区分出IPI分型无法确定的潜在不复发的患者,减少此类患者过度治疗的现象,从而降低患者的不良影响,有助于节省治疗成本,同时还能改善患者的生活条件。
- 蛋白质的序列设计方法、蛋白质的结构设计方法、装置及电子设备-202210120554.X
- 王天元;翟珂;吴炜坤;张琳 - 北京晶泰科技有限公司
- 2022-02-09 - 2022-05-17 - G16B20/50
- 本申请涉及一种蛋白质的序列设计方法、蛋白质的结构设计方法、装置及电子设备。该序列设计方法包括:获取具有预设长度的起始序列和对应的角度距离分布;其中,起始序列为包括目标基序的序列或随机序列;以起始序列开始对单个氨基酸进行随机突变,及依序根据前一次突变后的氨基酸序列及对应的角度距离分布对单个氨基酸进行当前随机突变,并分别按照预设损失函数根据对应的角度距离分布确定各突变后的氨基酸序列对应的变化值;选取变化值符合预设条件的氨基酸序列作为优选序列。本申请提供的方案,能够有效地获得优选序列,提高研发效率和降低研发成本。
- NGS肿瘤基因突变检测降噪方法-202210098326.7
- 黄松林;张惠丹 - 苏州绘真生物科技有限公司;苏州绘真医学检验有限公司
- 2022-01-27 - 2022-05-13 - G16B20/50
- 本发明公开了NGS肿瘤基因突变检测降噪方法,包括以下步骤:步骤一:提前准备好四个数据库:靶点数据库、人群频率数据库、噪音数据库、STR数据库。靶点数据库的收集主要包括两个方面,一个是从NCCN、FDA、NMPA等机构发布的文档或者其官方文档中整理,另一个是下载Clinvar、OncoKB、Cosmic数据库中致病或可能致病的突变位点。本发明能够显著降低肿瘤基因检测结果的噪音,呈现真实有效的突变位点,提高肿瘤基因检测的准确性,并降低生信分析人员的时间成本。
- 构建突变集合的方法及其应用-202011163812.X
- 谢刚;黄树嘉;金鑫;尹烨;王洪琦 - 深圳华大基因股份有限公司;深圳华大法医科技有限公司
- 2020-10-27 - 2022-05-13 - G16B20/50
- 本发明提供了一种构建突变集合的方法及其应用,该方法包括:(1)基于所述群体的个体总数和预先确定的碰撞概率阈值,确定所述突变集合中突变位点数目的最小值;和(2)从预先确定的初始集合中,选择预定数目的突变,以便获得所述突变集合,所述预定数目不小于步骤(1)中的所述最小值,其中,所述初始集合包括多个突变位点,所述多个突变位点的至少一部分满足下列条件:(a)所述突变位点的最大基因型概率不超过0.5;(b)所述突变位点的杂合比例不小于0.4;(c)所述突变位点不在重复序列区域中;(d)所述多个突变位点之间不存在连锁不平衡关系;和(e)所述突变位点满足哈温伯格平衡。
- 一种肿瘤新抗原特征分析与免疫原性预测工具及其应用-202210117578.X
- 刘雪松;王轩;吴涛 - 上海科技大学
- 2022-02-08 - 2022-05-06 - G16B20/50
- 本发明涉及一种肿瘤新抗原特征分析与免疫原性预测工具及其应用,属于生物信息学和肿瘤免疫治疗技术领域。本发明提供一种肿瘤新抗原特征分析与免疫原性预测方法,并应用该方法提供一种肿瘤新抗原多角度特征分析以及免疫原性预测的工具。工具从原始测序数据出发,识别出突变位点以及病人的HLA类型;预测突变多肽与HLAI以及HLAII的亲和力;突变肽相比野生肽与HLA亲和力差异;突变肽的转运效率;突变肽所在基因的表达水平等新抗原特征。该工具直接预测给定新抗原激活特异性CD8+T细胞的潜力。对肿瘤新抗原识别,肿瘤疫苗设计,肿瘤精准免疫靶点寻找开发均有重要价值。
- 用于检测肿瘤突变负荷的方法、计算设备和计算机存储介质-202010443187.8
- 柳文进;施巍炜;车月 - 至本医疗科技(上海)有限公司
- 2020-05-22 - 2022-04-29 - G16B20/50
- 本公开涉及一种用于检测肿瘤突变负荷的方法、计算设备和计算机存储介质。该方法包括:获取待测对象的血液样本的循环肿瘤基因(ctDNA)测序结果;基于ctDNA测序结果,确定与每个位点相关联的突变碱基类型和突变频率,以便生成待测对象的突变位点信息;比较待测对象的突变位点信息和健康对象突变位点数据集,以便生成差异突变位点集合,健康对象突变位点数据集是基于多个健康对象的ctDNA测序结果而生成的;确定点突变和短插入/缺失变异信息;以及利用差异突变位点集合,针对所确定的点突变和短插入/缺失变异信息进行过滤,以便确定阳性突变位点的数量。本公开能够准确、便捷以及稳定地检测肿瘤突变负荷。
- 基于生物网络和亚细胞定位数据识别癌症驱动模块方法-202011172944.9
- 杨冀帆;吴璟莉;李高仕 - 广西师范大学
- 2020-10-28 - 2022-04-22 - G16B20/50
- 本发明公开了基于生物网络和亚细胞定位数据识别癌症驱动模块方法,包括如下步骤:1)输入数据;2)重建无向边缘加权PPI网络;3)识别驱动程序模块;4)初始化;5)记录最佳个体;6)进入;7)使用五个突变算子产生;8)选择;9)完成驱动模块识别。这种方法克服了传统PPI网络中的假阳性或假阴性的不足,提高了在PPI网络上识别癌症的驱动模块的准确性。
- 一种遗传突变的处理方法及装置-201810278604.0
- 吴超;张乔 - 北京恒华永力电力工程有限公司
- 2018-03-30 - 2022-04-15 - G16B20/50
- 本发明公开了一种遗传突变处理方法,所述方法包括:确定个体的遗传突变特征,所述遗传突变特征包括:突变是否影响基因产生蛋白质变质、突变已知的致病性和突变的频率;根据上述遗传突变的特征来进行突变筛选;通过预设的遗传突变的破坏性以及预设的遗传突变所在的基因和个体表征的关系,对所述筛选后的遗传突变进行排序。由此,减少了后续的分子诊断和治疗成本。
- 一种高通量测序杂合度降低风险注释方法及系统-202111664794.8
- 刘洪洲;李冬梅;喻长顺;陈建春;贾晓冬;李行;汲珊珊 - 天津金域医学检验实验室有限公司
- 2021-12-31 - 2022-04-12 - G16B20/50
- 本发明公开了一种高通量测序杂合度降低风险注释方法,对家系三样本高通量测序数据先证者位点进行杂合度降低风险筛选并对遗传来源标记,包括对先证者纯合位点进行风险标记,对位点的遗传来源进行同时标记,具体筛选和标记为:对测序质量可靠及人群频率纯合的新发变异进行筛选标记,即对纯合的父母都没有的变异进行筛选标记;对测序质量可靠及人群频率纯合的只遗传父亲的变异进行筛选标记;对测序质量可靠及人群频率纯合的只遗传母亲的变异进行筛选标记;对测序质量可靠及人群频率纯合的父母都有的变异进行筛选标记;本发明还公开了一种高通量测序杂合度降低风险注释系统,分析效率高,逻辑清晰,检出率高。
- 预测线粒体DNA突变阈值、生育风险和取卵数的方法-202111293327.9
- 曹云霞;纪冬梅;杜忆南;张宁;张智康;刘卓立;邹薇薇;宗凯 - 安徽医科大学第一附属医院
- 2021-11-03 - 2022-04-12 - G16B20/50
- 本发明公开预测线粒体DNA突变阈值、生育风险和取卵数的方法,包括以下步骤:先建立线粒体突变发病概率预测模型并估算突变阈值s,再建立生育风险预测模型并预测突变携带者的生育风险p,然后利用二项分布建立卵母细胞提取预测模型并计算突变携带者的PGT取卵数;本发明使用发病概率预测模型估算常见mtDNA突变的阈值,并预测母亲的生育风险和PGT取卵数,在建立的生育风险预测模型和取卵预测模型的基础上,只需要知道突变携带者的线粒体DNA突变比例就可以计算其生育风险与生育一个健康子代所需的最小PGT取卵数,有助于临床医生对携带mtDNA异质突变的家庭进行遗传管理并提供遗传咨询,并提供PGT的标准指南。
- 一种全外显子组测序注释表自动生成标准化报告方法-202210010414.7
- 刘洪洲;李恪;李冬梅;喻长顺;刘晴晴;王燕霞;赵丽丽;陈建春;贾晓冬;李行 - 天津金域医学检验实验室有限公司
- 2022-01-06 - 2022-04-05 - G16B20/50
- 本发明提供一种全外显子组测序注释表自动生成标准化报告方法,包括读取所述全外显子组测序注释表,提取先证者及其父母的变异信息、变异位点的信息;调取基因‑疾病数据库,依据字段验证策略进行逻辑判断,根据判断结果依照第一输出条件、第二输出条件、第三输出条件、第四输出条件、第五输出条件在检测结果简述、基因突变结果、建议与解释、其他建议、基因变异的解释部分输出内容;如有1‑4级SNV变异,则生成对应图表模板,根据表格文件信息填写实验号;如有5级SNV变异,输出5级SNV附表,判断是否存在5级CNV变异,是则在5级SNV附表后追加生成5级CNV变异简表作为最终报告附表输出。本发明能够实现变异筛选后报告的一键生成。
- 用于对未知重要性的变体划分优先级顺序的系统和方法-201680044272.9
- V·阿格拉瓦尔;N·迪米特罗娃 - 皇家飞利浦有限公司
- 2016-07-26 - 2022-04-05 - G16B20/50
- 本公开内容描述了用于基于基因的变体对疾病的潜在重要性来生成针对所述基因的所述变体的优先级评分的系统和方法。可以针对多个变体计算优先级评分,并且可以基于所生成的优先级评分对所述变体进行排序。
- 无创产前基因检测测序数据的分析方法、装置及存储介质-202210032341.1
- 李佳;周思;鞠佳;许雯秋;苏茜;赵立见 - 深圳华大基因股份有限公司
- 2022-01-12 - 2022-04-01 - G16B20/50
- 本申请公开了一种无创产前基因检测测序数据的分析方法、装置及存储介质。本申请方法包括,从NIPT测序数据中获取出现两条或以上染色体非整倍体的样本的原始测序结果,将其与参考基因组比对,去除不匹配或重复reads;根据NIFTY算法计算除Y和19号染色体外的其他染色体的Z值,计算Z值绝对值前五的平均值,如果其大于阈值,则判断待测对象为肿瘤高风险人群。本申请首次利用NIPT检测中MCA样本的染色体Z值绝对值前五的平均值评估孕期肿瘤情况,本申请分析方法直接利用NIPT测序数据即可,简单方便,没有NIPT测序以外的额外成本,进一步扩展了NIPT在检测妊娠期隐匿性母体癌症中的使用。
- 用于确定肿瘤突变负荷的状态的方法、设备和存储介质-202210125429.8
- 王堃;魏金旺;王冠 - 领星生物科技(上海)有限公司;上海领安生物科技有限公司;启东领星医学检验实验室有限公司
- 2022-02-10 - 2022-04-01 - G16B20/50
- 本公开的实施例涉及用于确定肿瘤突变负荷的状态的方法、电子设备和存储介质,涉及生物信息领域。根据该方法,获取针对基因组合的测序数据和基因组合的捕获区域的长度,测序数据与目标对象的肿瘤样本相关联,肿瘤样本与目标肿瘤类型相关联;基于测序数据和长度,确定第一肿瘤突变负荷;获取与目标肿瘤类型相关联的多个对象的多个全外显子测序结果;对于每个全外显子测序结果,基于全外显子测序结果和长度,确定基因组合的捕获区域中的第二肿瘤突变负荷;以及基于第一肿瘤突变负荷和与多个全外显子测序结果相关联的多个第二肿瘤突变负荷,确定目标对象的肿瘤突变负荷的状态。由此,能够实现针对基因组合和肿瘤类型确定肿瘤突变负荷的状态。
- 一种肿瘤突变负荷的检测试剂盒及其检测方法和装置-202010221259.4
- 李文斌;姚天然;钱志荣;郭蕾 - 中国医学科学院肿瘤医院;北斗生命科学(广州)有限公司
- 2020-03-26 - 2022-04-01 - G16B20/50
- 本发明公开了一种肿瘤突变负荷的检测试剂盒及其检测方法和装置,涉及生物信息技术领域,具体而言,该检测试剂盒包括有用于检测9个基因的启动子和/或其上游区域的核酸组合1~9,基于该核酸组合1~9,能够获取待测样本的肿瘤突变负荷,有效缩短了预测待测样本TMB状态的时间,节省了检测的成本,利于肿瘤免疫治疗的研究。
- 一种遗传突变的排序方法及装置-201810291733.3
- 吴超;张乔 - 北京恒华永力电力工程有限公司
- 2018-03-30 - 2022-03-25 - G16B20/50
- 本发明提供了一种遗传突变的排序方法,所述方法包括:对遗传突变本身携带的信息进行打分,确定第一得分,所述遗传突变本身携带的信息包括:遗传突变的破坏性和是否为已知致病突变;对遗传突变所在的基因和个体表型特征的关系进行打分,确定第二得分;将所述第一得分和所述第二得分进行加权处理,得到第三得分;根据所述第三得分,对筛选后的所述遗传突变进行排序。由此,减少了后续的分子诊断和治疗成本。
- 一种同源重组修复基因变异的解读方法-202111344093.6
- 曹善柏;梁夏源;郭璟;楼峰 - 北京橡鑫生物科技有限公司;天津橡鑫生物科技有限公司;天津橡鑫医疗器械有限公司
- 2021-11-15 - 2022-03-25 - G16B20/50
- 本申请属于医学信息技术领域,具体公开了一种同源重组修复基因变异的解读方法,所述方法包括受检者的生物信息学解读方法和临床数据的解读方法。本申请至少具有以下有益效果之一:本申请提供的同源重组修复基因变异的解读方法,其通过将受检者的生物信息学解读方法和临床数据相结合,从而使对受试者的基因组变异解读更加准确,更贴近临床需求。
- 一种肺癌围手术期分子残留病灶基因检测panel及检测模型的构建方法-202111519375.5
- 许明炎;何长寿;周衍庆;陈亚如;陈实富;杨庆;刘园园;张晓妮 - 深圳市海普洛斯生物科技有限公司
- 2021-12-13 - 2022-03-15 - G16B20/50
- 本发明提供了一种肺癌围手术期分子残留病灶基因检测panel及检测模型的构建方法,涉及生物信息学技术领域。本发明通过整合肿瘤数据库和TCGA、COSMIC等著名肿瘤公共数据库,设计了一款覆盖肺癌驱动基因、靶向用药基因及热点突变的肺癌MRD基因检测panel,并开发了一套检测超低频基因突变预测模型。本发明以大样本量数据作为基础,聚焦肺癌驱动基因和热点突变,保证检测结果准确性;超高测序深度,保证了超低频检测限,超低频基因突变算法,提高突变检测精准度。本发明实施例证实,所述预测模型可以稳定检测0.02%的超低频突变。
- 一种基于核分数和组织病理全玻片图像的三阴性乳腺癌肿瘤突变负荷预测方法及系统-202111333910.8
- 刘娟;陈玉琦;冯晶 - 武汉大学
- 2021-11-11 - 2022-03-11 - G16B20/50
- 本发明提供了一种基于核分数和组织病理全玻片图像的三阴性乳腺癌肿瘤突变负荷预测方法及系统,其中的方法首先筛选三阴性乳腺癌组织病理全玻片;然后根据每个三阴性乳腺癌患者的基因突变情况,计算每个患者的肿瘤突变负荷值,并根据设定的阈值划分为肿瘤突变负荷高和低两组;接着将三阴性乳腺癌组织病理全玻片图像切分为设定大小的patch;再根据核分数函数筛选出一定数量高核分数的patch;然后搭建CNN分类模型,并随机初始化CNN模型的参数;最后将筛选出来的patch放入搭建的CNN模型中训练,实现用三阴性乳腺癌组织病理全玻片图像自动预测肿瘤突变负荷高或低的结果。本发明大大提高肿瘤突变负荷的检测速度和准确些,有助于免疫治疗的推进。
- 一种新生儿遗传病致病基因突变位点分析方法-202111507250.0
- 胡晶晶;王娟;陈伟坚 - 上海品峰医疗科技有限公司
- 2021-12-10 - 2022-03-11 - G16B20/50
- 本发明公开了一种新生儿遗传病致病基因突变位点分析方法,包括基础数据收集方法、采样标记方法和结论分析方法。该新生儿遗传病致病基因突变位点分析方法,对新生儿易得的遗传病致病基因突变位点进行统计,然后通过对进行新生儿遗传病致病基因突变位点分析的新生儿进行持续性采样,阶段性对比分析和家族遗传对比,以得到新生儿最可能得的遗传性疾病,同时可以进行针对性的观察遗传性疾病的基因位点突变发展历程,方便及时治疗和后续治疗,同时通过对每次新生儿遗传病致病基因突变位点分析的结果进行反向录入,增加大数据统计信息库的储存,无需通过分析,仅通过大数据的基因标记位点的对比,即可大概率得出所得疾病。
- 计算机抗体组合突变进化系统及方法、信息数据处理终端-201810933901.4
- 林江宏;郑蓉;张积林 - 福建工程学院
- 2018-08-16 - 2022-03-11 - G16B20/50
- 本发明属于计算机软件技术领域,公开了一种计算机抗体组合突变进化系统及方法、信息数据处理终端,所述计算机抗体组合突变进化方法采用遗传算法搜索策略,通过多次循环计算,针对抗体结合口袋的多个氨基酸位点,生成组合突变体的结构数据库,并以特定的结合自由能函数为亲和力评价方法,自动地进化得到组合突变抗体。所述计算机抗体组合突变进化方法采用遗传算法搜索策略,通过多次循环计算,针对抗体结合口袋的多个氨基酸位点,生成组合突变体的结构数据库,并以特定的结合自由能函数为亲和力评价方法,自动地进化得到组合突变抗体。
- 专利分类