[发明专利]一种基于融合神经网络的LncRNA-疾病关联预测方法在审
申请号: | 202211451740.8 | 申请日: | 2022-11-21 |
公开(公告)号: | CN115691817A | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 李巧君;杨伟;李江岱;庞士昱;石晨;冯贤菊 | 申请(专利权)人: | 河南工业职业技术学院 |
主分类号: | G16H50/50 | 分类号: | G16H50/50;G06N3/0455;G06N3/0464;G06N3/0442;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 473000 河南*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 融合 神经网络 lncrna 疾病 关联 预测 方法 | ||
本发明提供了一种基于融合神经网络FNN(Fusion Neural Networks,FNN)和栈式自编码器(Stacked Autoencoder,SAE)的LncRNA‑疾病关联预测方法,属于LncRNA与疾病关联预测技术领域。首先,整合LncRNA功能相似性、疾病语义相似性、LncRNA‑疾病互作、LncRNA‑miRNA相互作用以及miRNA‑疾病关联多源数据构建特征矩阵;其次,基于SAE模块学习LncRNA‑疾病对的低维网络表示,基于融合神经网络FNN模块进行高阶特征的提取,学习LncRNA‑疾病时间依赖和共享参数的高级特征,两个模块都经过全连接层和softmax层,得到LncRNA‑疾病的相关可能性即关联得分;最后,赋予两个模块的预测分值不同的权值,对分值进行加权融合得到预测得分,从而筛选出与疾病关联的潜在LncRNA,为科研人员确定与疾病关联的候选LncRNA提供辅助决策。
技术领域
本发明属于LncRNA与疾病关联预测技术领域,尤其涉及一种基于融合神经网络的LncRNA与疾病关联预测方法。
背景技术
长非编码RNA(Long non-coding RNA,LncRNA)是一种非蛋白编码RNA,其长度超过200个核苷酸,过去人们普遍认为LncRNA对基因表达几乎没有影响。目前,诸多研究表明人类身体各种复杂疾病(如癌症)的形成发展与LncRNA的突变和失调的病理机制密切相关。LncRNA GMAN或ephrin A1的调节机制在胃肿瘤转移和发展过程中发挥了重要的调控作用;在癌症进行免疫治疗过程中,命名为LIMIT的癌症免疫原性LncRNA可能是治疗靶点;LncRNA-HOTAIR在不同的癌细胞中扮演着致癌分子的角色,其表达水平是乳腺癌、胃癌、结直肠癌和宫颈癌等癌症诊断和治疗的潜在生物标志物。因此,识别疾病相关的LncRNA将有助于在LncRNA水平上了解人类复杂的疾病机制、疾病诊断和治疗。近年来随着生物技术的发展,实验发现的LncRNA-疾病关联数据逐渐增加,研究者整理这些数据并建立了LncRNADisease、Lnc2Cancer、HDMM等LncRNA-疾病关联数据库。目前,已知的LncRNA-疾病关联仅仅只是小部分,而生物实验验证耗时长且成本昂贵。随着人工智能技术的发展和大数据技术的成熟,研究人员利用计算方法分析和处理已知数据,能够加速发现LncRNA和疾病之间的潜在关联,已成为生物实验识别LncRNA-疾病关联的有效补充。基于计算的LncRNA-疾病关联预测方法分为基于矩阵分解的方法和基于机器学习的方法两类。目前,由于生物数据的完整性、模型选择和实验设计等各个方面仍存在一定的局限性,现有的LncRNA-疾病预测方法仍然面临着许多挑战。
发明内容
本发明目的是提供一种预测精准度更高的关联预测方法,为实现这一目地,本发明基于LncRNA与疾病关联数据来源类型多,特征提取不够充分的特点,提出一种基于融合神经网络和栈式自编码器的LncRNA与疾病关联预测方法,整体框架见图1所示,本发明技术方案的整体步骤如下:
1)整合了LncRNA相似性、疾病相似性、LncRNA-疾病关联、LncRNA-miRNA相互作用以及miRNA-疾病关联等多源数据构建特征矩阵,并将构建的特征矩阵分别输入到方法的两个模块,其中LncRNA 和疾病 关联特征示例见图2所示;
2)基于栈氏自编码器SAE的特征提取模块学习LncRNA-疾病对的低维网络表示,基于融合神经网络FNN的特征提取模块充分利用卷积神经网络(Convolutional NeuralNetwork,CNN)和长短期记忆递归神经网络(Long Short Term Memory,LSTM)的不同优势,学习LncRNA-疾病时间依赖和共享参数的高级特征。两个模块都经过全连接层和softmax层,得到LncRNA-疾病的相关可能性即关联得分;
3)最后赋予两个模块的预测分值不同的权值,对分值进行加权融合得到预测得分,从而筛选出疾病相关LncRNA。
附图说明
图1体系结构图
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南工业职业技术学院,未经河南工业职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211451740.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于页岩气开采的压裂泵传动机构
- 下一篇:便于调整的激波报靶系统