[发明专利]一种基于噪声利用的基因重要性评价方法在审
申请号: | 202210476942.1 | 申请日: | 2022-05-02 |
公开(公告)号: | CN114913924A | 公开(公告)日: | 2022-08-16 |
发明(设计)人: | 高福根;李钧涛;梁聪;王小玉;吴英迪;梁柯;曹福珍;张红梅;崔鲁宾;丁莹 | 申请(专利权)人: | 李钧涛 |
主分类号: | G16B40/20 | 分类号: | G16B40/20;G16B40/30;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 453007 河南省新乡市牧野区*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 噪声 利用 基因 重要性 评价 方法 | ||
本发明公开了一种基于噪声利用的基因重要性评价方法,主要用来解决生物工程中相关基因数据的噪声处理和生物基因的重要性评价。该方法首先对实验数据进行基因差异分析,筛选出差异表达的基因数据;然后利用鲁棒主成分分析将其分解为低秩干净矩阵和稀疏噪声矩阵;接着根据加权基因共表达网络分析的识别模块对基因分群,并将低秩干净矩阵和稀疏噪声矩阵分块;最后分别在低秩干净矩阵和稀疏噪声矩阵上评估基因有效性与可靠性,完成基因的鲁棒重要性评价。本发明将实验数据中的噪声充分利用起来,构建的基因评价准则具有一定的鲁棒性,且易于操作。此方法可应用于生物基因的重要性评价,对于癌症的预测,新药的筛选具有重要应用价值。
技术领域
本发明属于生物工程技术领域,具体涉及一种基于噪声利用的基因重要性评价方法。
背景技术
生物工程是以生物学、遗传学等学科的理论和技术为基础,结合现代工程技术,对遗传物质进行操纵、改变生物性状,使生物产生对人类有用的代谢产物的一门技术,包括基因工程、细胞工程、微生物工程、酶工程和蛋白质工程。生物工程的应用十分广泛,涉及医药、化工、食品、农业等诸多领域。它为世界面临的资源、环境和人类健康等问题的解决提供美好的前景。
随着生物技术中先进技术手段与仪器设备的迅速发展,海量的生物学数据不断被生成。例如,由微阵列技术同时对大量基因序列进行检测和分析而得到的基因表达谱数据。这些数据的特性与关系都蕴含着重要的模式信息。基因表达谱数据的出现,使人们可以从分子水平上了解细胞的病变过程,这对于癌症的发病机理及癌症的诊断有着非常重大的意义。因此,如何分析和利用基因表达谱数据,并从中挖掘出与人类疾病相关的基因是当今的研究热点。
然而,基因表达谱数据的显著特点是小样本、高维度、基因之间存在很大的相关性。这不仅容易引发“维度灾难”,而且对癌症的分类预测性能产生极大的影响。于是在分析基因表达谱数据之前,必须对基因作特征选择。此外,根据生物医学观点,细胞癌变通常并不是由所有基因引起的。少数基因的突变对细胞的癌变起着关键作用,为了突出基因重要性的差异以及量化基因的贡献,需要评价基因的重要性。
另一方面,在实际中,数据中往往因环境或收集数据的设备干扰而存在着异常值,通常被称为噪声。在基因测序过程中,由于仪器电磁干扰等因素,基因表达谱数据不可避免地包含一定的噪声信息,噪声的存在可能会影响模型的分类性能。为了去除噪声,国内外学者对此进行了大量研究。事实上,基因表达谱数据中的噪声冗余大并且可能是任意的。因此,对于噪声信息的处理以及基因的重要性评价,是生物工程领域一个急需解决的问题。
发明内容
本发明的目的在于:本发明提出了一种基于噪声利用的基因重要性评价方法。首先对实验数据筛选出差异表达的基因数据;然后利用鲁棒主成分分析将处理后的数据分解为低秩干净矩阵和稀疏噪声矩阵;接着在低秩干净矩阵上评估基因的有效性,并利用稀疏噪声矩阵计算基因的可靠性;最后得到具有鲁棒性的基因重要性评价准则。
本发明为实现上述目的采用如下技术方案,通过对实验数据进行基因差异分析筛选出差异表达的基因数据,并利用鲁棒主成分分析将处理后的数据分解为低秩干净矩阵和稀疏噪声矩阵。在此基础上,利用加权基因共表达网络分析(WGCNA)的识别模块对基因分群,进而对低秩干净矩阵和稀疏噪声矩阵进行分块;然后基于分块结果,在低秩干净矩阵上评估基因的有效性,并利用稀疏噪声矩阵计算基因的可靠性;最后,基于基因的有效性和可靠性构建鲁棒评价准则,进而完成基因的重要性评价。其实现步骤如下:
步骤1,对生物学数据中的基因进行差异分析,通过设置|log2FoldChange|≥k,筛选出差异表达的基因,其中FoldChange为基因表达值的差异倍数,k为提前指定的阈值参数,是一个大于0的实数;
步骤2,将步骤1处理后的数据记为矩阵X,通过鲁棒主成分分析将矩阵X分解为低秩干净矩阵D和稀疏噪声矩阵E;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于李钧涛,未经李钧涛许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210476942.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种翻转Γ源的双向直流固态断路器
- 下一篇:一种用于鳗鱼养殖的尾水处理方法