[发明专利]一种基于相似性和逻辑矩阵分解的miRNA‑疾病关联关系预测方法在审
| 申请号: | 201711075296.3 | 申请日: | 2017-11-06 |
| 公开(公告)号: | CN107862179A | 公开(公告)日: | 2018-03-30 |
| 发明(设计)人: | 王建新;倪鹏;严承;李敏;朱晓姝 | 申请(专利权)人: | 中南大学 |
| 主分类号: | G06F19/24 | 分类号: | G06F19/24;G06F19/20 |
| 代理公司: | 长沙市融智专利事务所43114 | 代理人: | 杨萍 |
| 地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 相似性 逻辑 矩阵 分解 mirna 疾病 关联 关系 预测 方法 | ||
技术领域
本发明属于系统生物学领域,涉及一种基于相似性和逻辑矩阵分解的miRNA-疾病关联关系预测方法。
背景技术
越来越多的研究表明miRNA作为一类长度约等于22nt的非编码RNA,在许多人类复杂疾病中起着非常重要的作用。因此识别miRNA和疾病之间的关联关系,这将对疾病机制的理解,药物的开发,疾病的治疗产生很大的推动作用。而众所周知的是通过生物测定方法对miRNA- 疾病相互作用进行识别,是非常昂贵的、耗时的和具有挑战性的,但是计算模型能够提供一种低成本,高效率的方法对miRNA-疾病关系进行预测。故随着计算技术的发展,目前出现了相对多的算法对miRNA和疾病关系进行预测。
目前,用于miRNA-疾病关系预测的方法主要有3大类:
(1)生物实验测定方法
这个是最传统,最原始的识别方法,目前典型的miRNA-疾病关系数据库HMDD就是在此类数据上构建的,这个也是最基础的数据来源。
(2)基于网络的预测方法
这类方法利用已知miRNA-疾病关联关系数据,基于相似的miRNA与之存在关联关系的疾病也相似的特点,通过集成miRNA功能相似性、疾病语义相似性、已有的miRNA-疾病关联关系等信息,为miRNA-疾病关系的确认提供了重要的辅助作用,也为后续的医学研究提供了基础,当前这类方法已经成为miRNA-疾病关系预测的重要工具。
比如在RWRMDA方法中,利用miRNA功能相似性和全局网络相似性特点来预测未知的 miRNA-疾病关系。HDMP方法通过权重K近邻思想来推断miRNA-疾病关系,其主要贡献在于利用了miRNA的家族和聚类信息进一步提高了其功能相似性。在PBMDA方法中,其通过集成已知 miRNA-疾病关联关系、miRNA功能相似性和疾病语义相似性,以及miRNA和疾病的高斯核相似性来进行miRNA-疾病关联关系进行预测。
(3)其他基于机器学习的预测方法
基于矩阵分解的预测模型也是一个很重要的方法,在KBMF-MDI方法中,其通过集成miRNA 的功能相似性和序列相似性,疾病的语义相似性和功能相似性来进行新的miRNA-疾病关联关系的预测。RLSMDA作为一个半监督的miRNA-疾病预测方法,其不但能够对已知有关联miRNA 的疾病的miRNA进行预测,也能够对全新的疾病进行预测。
尽管上述这些方法在预测miRNA-疾病关系方面取得了一些良好的效果,为医学研究提供了重要的依据,但仍存在一些不足的地方,比如生物实验测定方法需要大量的人力,财力,物力来进行实验,基于网络的预测方法和其他基于机器学习的预测方法预测准确性仍需进一步提高。因此,有必要设计一种新的miRNA-疾病关联关系预测的方法。
发明内容
本发明所要解决的技术问题是,针对现有技术的不足,提供一种基于相似性和逻辑矩阵分解的miRNA-疾病关系预测方法,有效避免生物化学实验所消耗的大量人力物力,且能够较准确的预测miRNA-疾病关系。
本发明的技术解决方案如下:
一种基于相似性和逻辑矩阵分解的miRNA-疾病关联关系预测方法,包括以下步骤:
步骤1:构建疾病功能相似性矩阵Dfunsim;
步骤2:构建miRNA功能相似性矩阵Mfunsim;
步骤3:根据已知的miRNA-疾病关联关系分别构建miRNA高斯核相似性矩阵KGIP,m和疾病高斯核相似性矩阵KGIP,d;
步骤4:基于miRNA功能相似性矩阵Mfunsim和高斯核相似性矩阵KGIP,m计算miRNA最终相似性矩阵Sm;基于疾病功能相似性矩阵Dfunsim和高斯核相似性矩阵KGIP,d计算疾病最终相似性矩阵Sd;
步骤5:首先根据已知的miRNA-疾病关联关系、miRNA最终相似性矩阵Sm和疾病最终相似性矩阵Sd,利用逻辑矩阵分解构建miRNA-疾病关联关系预测模型;然后通过动态近邻正则化对预测模型进行优化;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711075296.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:序列比对的状态监控装置及方法
- 下一篇:软件禁用处理方法和装置
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用





