[发明专利]基因芯片差别基因识别方法在审
| 申请号: | 201410376287.8 | 申请日: | 2014-08-03 |
| 公开(公告)号: | CN105316400A | 公开(公告)日: | 2016-02-10 |
| 发明(设计)人: | 严冰冰;易雪莲;邹晓文;孔祥生 | 申请(专利权)人: | 晶能生物技术(上海)有限公司 |
| 主分类号: | C12Q1/68 | 分类号: | C12Q1/68 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 201111 上海市闵*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基因芯片 差别 基因 识别 方法 | ||
技术领域
本发明属于分子生物学技术领域以及信息技术领域,本发明涉及一种基因芯片差别基因识别方法,本方法适用于小样本的基因芯片实验设计。
背景技术
基因芯片,是指将许多已知序列寡核苷酸或cDNA片段有规律地排列在基片上,将待测的样品与芯片互补配对原则进行杂交。通过荧光检测系统对芯片进行扫描,并配以计算机系统对每一探针上的荧光信号做出检测和比较,可以迅速得出实验结果。基因芯片可以对大量基因的表达水平进行快速、准确、高效地检测,且只需要少量样品。基因芯片技术有效且应用广泛。
差别基因的识别是基因芯片分析及其重要的步骤。但是实际中,由于基因芯片价格昂贵,样本数量少,这类芯片数据目前的分析方法基本上是经验算法,其敏感性与特异性难以估计,有较大误差。本发明我们提出一种新算法,来对小样本基因芯片产生的差别基因进行筛选。
发明内容
本发明的目的在于公开一种基因芯片差别基因识别方法,对小样本基因芯片差别基因进行筛选。
为此,本发明给出的技术方案为:
步骤1,对芯片基因数据进行归一化处理,得到各芯片基因数据归一化数据D;
步骤2,获取已知基因序列库L,以及各基因数据归一化表述DL;
步骤3,设定差异阈值T;
步骤4,将基因芯片中基因和基因库中基因进行比较,获取二者差异DIFF=D-DL;
步骤5,步骤4中,如果基因芯片中基因和基因库中所有基因的差异DIFF均大于阈值T,则定义为差别基因。
本方法适用于小样本的基因芯片实验设计,克服了常规方法难以对小样本基因芯片进行差别基因片段的缺陷。
具体实施方式
以下结合实施例对本发明技术方案做进一步说明。
本实施例中采用的本领域的常规方法对芯片数据进行归一化处理,如使用芯片扫描图像处理软件(例如GenePixpro4.0)获得基因水平的表达值数据。接着对芯片数据进行芯片间的归一化处理。
实施例1
步骤1,对芯片基因数据进行归一化处理,得到各芯片基因数据归一化数据D;
本步骤主要用于提取芯片上的基因数据,并对其进行归一化处理,便于后续的对比。比如采用GenePixpro4.0获得基因水平的表达值数据,接着对芯片数据进行芯片间的归一化处理。
步骤2,获取已知基因序列库L;
这里的基因序列库的获取可以来自于各种公开的方式。另外,这里的基因序列库可以局限在本芯片需要确认的基因中;也可以选取本芯片目的基因所属分类的基因库。原则为能够尽可能的完成基因对比覆盖。并得到库中各基因的归一化数据DL。
步骤3,设定差异阈值T;此处的阈值采用设置统一阈值的方式,也可以考虑针对不同基因进行不同的阈值设置。进一步,还可以根据温度等进行调整,加入调整因子k。
步骤4,将基因芯片中基因和基因库中基因进行比较;将从步骤1中获取的某芯片基因数据和基因库中各基因数据进行对比,得到其差异数据DIFF=D-DL。注意:这里的D是某个芯片基因数据,而DL是某个基因库数据。
步骤5,如果此芯片基因数据和基因库中各基因的差异DIFF均大于各自阈值,则定义为差别基因。如果设置了不同的阈值和调整因子,则在进行比较时,需要根据不同的条件采用不同的阈值。一个芯片基因数据识别完成后,选取下一个芯片基因数据重复步骤4和5,直到整个芯片数据识别完成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于晶能生物技术(上海)有限公司,未经晶能生物技术(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410376287.8/2.html,转载请声明来源钻瓜专利网。





