[发明专利]用于基于不一致性度量根据生物数据的亚群检测的方法、系统和装置在审
申请号: | 201780030793.3 | 申请日: | 2017-05-11 |
公开(公告)号: | CN109155151A | 公开(公告)日: | 2019-01-04 |
发明(设计)人: | K·沃良斯基;N·迪米特罗娃;Y·毛 | 申请(专利权)人: | 皇家飞利浦有限公司 |
主分类号: | G16B40/30 | 分类号: | G16B40/30 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 李光颖;王英 |
地址: | 荷兰艾*** | 国省代码: | 荷兰;NL |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 不一致性 亚群 生物数据 分区 生物有机体 度量 集群 样本 度量计算 检测 非零 汇编 分配 评估 | ||
公开了用于检测至少一种生物有机体的成分的亚群的方法、系统和装置。根据示范性实施例,根据至少一种生物有机体的成分汇编的生物数据样本的集群分区通过基于不一致性度量计算针对所述分区的不一致性得分来评估(114)。另外,针对多个分区中的至少一个,非零值被分配给仅具有一个生物数据样本的至少一个集群的所述不一致性度量。此外,所述亚群通过选择具有最小不一致性得分的分区作为所述亚群来识别。
技术领域
本文描述的各种实施例总体上涉及生物医学信息学技术。更具体地但非排他性地,本文公开的各种方法、系统和装置涉及生物信息学和基于生物数据对亚群的检测。
背景技术
生物信息学技术提供了用于分析生物有机体的有效手段,并且是若干生物领域的重要方面。特别地,生物信息学技术过程已经在基因组学以及对包括癌症的疾病的研究和处置方面取得了重大进展。癌症以及其他基因组疾病的特征在于支持从正常细胞到肿瘤细胞的演变的基因组结构变异和基因表达的异种模式。出于临床研究的目的,并且特别是出于在肿瘤发展和增殖中识别驾驶员和乘客事件的目的,从可用基因组数据解读并表征独特模式的能力具有高度重要性。
发明内容
目前可用的生物医学信息学和生物信息学技术的有效性相对有限,因为这些技术所采用的分析不能提供用于确定生物数据中的亚组或亚群的数量的确定且准确的手段。例如,基因图谱的复杂性和体积使得很难有效且准确地分析它们以便检测各种亚群,包括例如基于对整个肿瘤活组织检查的分析的癌症患者的同种亚组以及反映肿瘤细胞谱系和演变的克隆群体,以及异常、正常和疾病特异性细胞系的群体。
本公开涉及用于检测至少一种生物有机体的成分的亚群的方法、系统和装置。应用机器学习技术来发现这些类型的亚群是有问题的,因为数据内的类的数量通常是未知的。虽然非参数无监督式机器学习方法非常擅长检测个体样本的接近度并确定主要亚组(集群)的结构,但是它们无法提供正确数量的类的明确指示,而参数方法假设类的数量是事先知道的,这种情况很少发生。
为了在保持高准确度的同时提高亚群的检测的效率,能够对生物数据执行聚类过程以获得利用集群内不一致性度量(例如集群内的元素的成对统计方差)评估的集群分区。特别地,不是将单元素集群视为在集群内具有零不一致性,本申请的实施例而是将非零不一致性度量分配给单元素集群。本申请的发明人惊奇地发现,分析集群一致性并将一定程度的集群内不一致性分配给单元素集群使得能够出现具有根据分区水平来评估的不一致性得分的最小值的u形曲线。这里,已经发现对应于最小值的分区水平准确地表示生物数据中存在的集群和亚群的数量。因此,通过将非零不一致性度量分配给单元素集群,能够以高效且准确的方式检测亚群。
通常,在一个方面,示范性系统被配置为检测至少一种生物有机体的成分的亚群。这里,所述系统包括至少一个硬件处理器和非瞬态存储介质。所述处理器被配置为获得所述(一种或多种)生物有机体的所述成分的生物数据样本的多个分区,并且所述存储介质被配置为存储所述多个分区。另外,所述多个分区中的每个分区定义所述成分的所述生物数据样本的各自数量的集群。此外,所述处理器被配置为针对多个分区中的每个分区基于对集群内不一致性进行测量的不一致性度量来计算针对对应分区的不一致性得分,其中,针对所述多个分区中的至少一个,非零值被分配给仅具有一个生物数据样本的至少一个集群的所述不一致性度量。所述处理器还被配置为确定所述多个分区中的哪个分区具有最小不一致性得分,并且通过选择所述多个分区中具有所述最小不一致性得分的分区作为所述亚群来识别所述(一种或多种)生物有机体的所述成分的所述亚群。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于皇家飞利浦有限公司,未经皇家飞利浦有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780030793.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:从基因型测定表型
- 下一篇:临床报告检索和/或比较