[发明专利]一种基于深度学习的基因表达谱距离度量方法有效
申请号: | 201910296276.1 | 申请日: | 2019-04-13 |
公开(公告)号: | CN110033041B | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | 彭绍亮;刘伟;李非;杨亚宁;李肯立;卢新国;张磊;毕夏安 | 申请(专利权)人: | 湖南大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 国防科技大学专利服务中心 43202 | 代理人: | 王文惠 |
地址: | 410012 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 基因 表达 距离 度量 方法 | ||
本发明属于基因表达谱分类领域,公开了一种基于深度学习的基因表达谱距离度量方法,属于深度学习在生物大数据上的挖掘和应用。首先,设计了一种适用于基因特征度量学习的卷积神经网络模型来提取数据的特征,然后运用改进的余弦距离来计算数据之间的距离,最后通过分类算法的分类效果来衡量该方法的优良。该方法能够快速高效地度量出不同的基因表达谱之间的相似度,为后续的基因分类、聚类、差异性表达分析、化合物筛查等研究提供数据。相比较传统的基因富集方法,这种方法显著提高了数据之间的距离度量效果,并且可以有效的减少基因表达谱分析时候的人工干预,避免了常规深度网络易产生的过拟合现象,该方法有较强的可迁移性。
技术领域:
本发明属于基因表达谱分类领域,更具体的,涉及深度学习在基因表达谱数据上的挖掘和应用,特别涉及一种基于深度学习的基因表达谱距离度量方法。
背景技术:
目前,随着生物技术的飞速发展,生物医药领域的实验手段和研究方法均发生了巨大的变革,呈现出“大数据”的趋势。其中,表达谱数据相似度比较可应用于比较正常和异常细胞中基因的表达量水平,帮助识别疾病相关基因和药物作用靶标,分析复杂疾病的致病机制,因此,对于基因表达谱的相似度研究逐渐成为研究热点,目前业界比较认可基因表达谱相似度计算方式是GSEA(Gene Set Enrichment Analysis,基因探针富集分析)。但GSEA是一种先验方法,前期需要大量的生物学实验来获得先期数据,而且受限于其本身复杂的计算过程,目前GSEA方法难以达到需求的计算速度和计算准确度,无法满足海量表达谱分析的目标,所以急需新的方法来计算表达谱之间的相似度。度量学习能够通过学习样本数据来自动产生合适的度量空间进而进行相似度计算,而与深度学习相结合的度量学习方法能够通过组合大量简单的、非线性的模型将原始数据逐层转变成更高层次的、更加抽象的表达,从而发现表达谱数据之间的复杂结构和隐含信息,是一种理想的表达谱数据相似度计算方法。卷积神经网络是深度学习理论的一种方法,它的权值共享网络结构降低了网络模型的复杂度,减少了权值的数量,使之更类似于生物神经网络,近年来,深度度量学习尤其是卷积度量学习在模式识别方面取得较大进展,对比文件1(Gao H,Zhuang L,Maaten L V D,et al,IEEE Conference on Computer VisionPattern Recognition,2017,Densely Connected Convolutional Networks)采用了不同于以往网络中残差结构的稠密连接结构,并通过实验证明其性能超过了其他网络模型,有更好的特征提取能力,但是网络的输入需要严格按照正方形矩阵进行,而且网络的效果和输入数据密切相关。对比文件2(Wen Y,Zhang K,Li Z,et al,Computer Vision,2016,A Discriminative FeatureLearning Approach for Deep Face Recognition)提出了CenterLoss损失函数,保证了类内特征距离尽可能的小,但类间的距离却没有考虑到。现有用于基因表达谱相似度计算的距离度量方法研究很不充分,而与深度学习相结合应用于基因表达谱数据测距的方法尚缺少研究。
发明内容:
本发明需要解决的技术问题是,充分发挥深度度量学习能准确获取数据的特征并能快速而有效地计算数据之间距离的优势,以解决传统方法在计算基因表达谱距离性能不好、时间开销大的问题。通过该方法能实现将深度度量方法应用于基因表达谱,来计算表达谱数据之间距离的目的。为了实现本发明的目的,通过以下技术方案来实现:
一种基于深度学习的基因表达谱距离度量方法,包括以下步骤:
步骤一:数据转换处理,包括以下步骤,
1.1.将基因表达谱数据转换成正方形数据矩阵,正方形矩阵长度根据表达谱数据的维度来计算。具体计算方式是:将数据维度为N的样本,转换为x*x的正方形矩阵,其中x通过公式获得,多出来的像素位置补齐为0。
1.2.对正方形矩阵进行归一化和减均值数据预处理操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910296276.1/2.html,转载请声明来源钻瓜专利网。