[发明专利]具有动态基因分布的搜索空间遍历无效
| 申请号: | 200680029046.X | 申请日: | 2006-07-12 |
| 公开(公告)号: | CN101238467A | 公开(公告)日: | 2008-08-06 |
| 发明(设计)人: | A·亚内夫斯基;J·D·谢弗 | 申请(专利权)人: | 皇家飞利浦电子股份有限公司 |
| 主分类号: | G06F19/00 | 分类号: | G06F19/00 |
| 代理公司: | 永新专利商标代理有限公司 | 代理人: | 王英 |
| 地址: | 荷兰艾*** | 国省代码: | 荷兰;NL |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 具有 动态 基因 分布 搜索 空间 遍历 | ||
本发明涉及在基于基因组学的测试中的搜索过程领域,并且尤其涉及改进的方法,以在搜索过程中包括更多的测量值。
已知在很多领域中都存在子集选择问题,例如用于分子诊断的模式发现。在该领域中,典型地,可得到关于患者和发现这些测量值的子集的愿望的测量值数据,该患者具有或没有特定的疾病,并且,所述测量值的子集可以用于可靠地检测该疾病。演化计算是一种可用于根据可得到的测量值确定测量值的子集的已知方法。演化计算的范例可以在提交的专利申请WO199043和WO0206829中找到。
具有一些形式的子集选择的演化搜索算法具有一次考虑整个搜索空间中的子集的特点。例如,每个中具有15个基因的100个染色体的群体可以仅覆盖1500个不同的基因。如果搜索空间包含多于1500个基因,那么通常不能保证该算法对每个基因至少进行一次。对于该问题的蛮力解将增加群体的大小和/或染色体的大小,由于这增加了该算法的实质计算负担,因此,这通常是不实用的。
2004年12月28日提交的,名为“Method of GeneratingGenomics-Based Medical Diagnostic Tests”的美国专利申请号60/639,747,描述了一种用于确定分类器的方法,该分类器用于生成染色体的第一代染色体群体,其中,每个染色体具有选定数量的基因,这些基因指示相关测量值集合的子集,该专利文件的内容在此以引用的方式并入。在该所描述的方法中,染色体的基因在计算上被遗传地演化,从而产生连续代的染色体群体。每个继承代染色体群体的产生都包括:通过(i)以两个父代染色体共同的基因值填充子代染色体的基因,和(ii)以对于父代染色体中的一个或另一个来说唯一的基因值来填充剩余的基因,来根据该染色体群体中的父代染色体生成子代染色体;选择性地使子代染色体中对于父代染色体中的一个或另一个来说唯一的基因值发生突变,而不使子代染色体中两个父代染色体共同的基因值发生突变;并且基于使用每个染色体的基因指定的相关测量值的子集确定的该染色体的适合度来以子代染色体更新该染色体群体。然后,选择分类器,该分类器使用遗传演化所标识的染色体的基因指定的相关测量值的子集。
然而,该所描述的方法使用设计为引发精确的和小的子集的演化的两层(level)等级选择步骤,即适者生存。在该操作中,竞争解(competing solution)对于该问题指A和B,其被按照如下进行比较:
如果classification_errors(A)<classification_errors(B),那么选择A;
否则如果classification_errors(A)=classification_errors(B)且number_of_measurements(A)<number_of_measurements(B),那么选择A;
其他,随机选择A或B。
其中,classification_error()是适合度的测度。
一旦初始化,就将趋异和突变基因从可得到基因的池中随机地抽出。遗传算法的一个基本部分是在染色体交配过程中存在偶发的突变。对于任意的基因数量,以已知的概率使染色体基因发生突变。在特定的情况下,如果不允许染色体的复制,突变仅限于在染色体中还不存在的基因。在随机选择基因的其他场合,建立初始群体,且在趋异之后随机挑选大部分基因。
在所描述的过程中,以相同的概率,即1/n抽出新的基因,其中,n是允许成为该染色体的一部分的基因的数量。这使得由于许多基因不能被“抽出”以参与演化算法的循环,它们将不能被探察。
因此,在工业上需要允许在搜索过程中包括或测试所有基因的方法。
公开了用于从多个测量值中选择测量值的方法和装置。该方法包括如下步骤:对于每个测量值,将测量值状态初始化为第一值;基于相应的状态值确定多个测量值之一的可选性;并且在选择该测量值之后将该状态更新为第二值。在本发明的一方面,确定可选性的步骤还包括选择多个测量值之一并且当该相应状态的值为第一值时保留所选择的测量值的步骤。
本发明可以以不同部件和部件的排列以及不同过程操作和过程操作的排列来形成。附图仅仅为了说明优选实施例,而不构成对本发明的限制。
图1示出了用于根据本发明的第一原则选择基因的示例性过程;
图2示出了用于根据本发明的第二原则选择基因的第二示例性过程;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于皇家飞利浦电子股份有限公司,未经皇家飞利浦电子股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200680029046.X/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用





