[发明专利]一种基于卷积神经网络的核小体分类预测方法有效
申请号: | 201711011644.0 | 申请日: | 2017-10-25 |
公开(公告)号: | CN107545153B | 公开(公告)日: | 2021-06-11 |
发明(设计)人: | 樊永显;龚浩;蔡国永;张向文;张龙 | 申请(专利权)人: | 桂林电子科技大学 |
主分类号: | G16B40/00 | 分类号: | G16B40/00;G06N3/04 |
代理公司: | 桂林市华杰专利商标事务所有限责任公司 45112 | 代理人: | 刘梅芳 |
地址: | 541004 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 神经网络 小体 分类 预测 方法 | ||
本发明公开了一种基于卷积神经网络的核小体分类预测方法,其特征是,包括如下步骤:1)特征提取;2)提取核小体或链接体DNA序列中核苷酸的物理化学属性;3)添加生物特性;4)获取第24维向量;5)添加核苷酸化学性质;6)得到包含生物信息的矩阵;7)构建卷积神经网络结构;8)分类核小体。这种方法能精准预测核小体的分类。
技术领域
本发明涉及遗传学的分类预测,具体是一种基于卷积神经网络的核小体分类预测方法。
背景技术
核小体预测是目前遗传学研究的重要内容,核小体的特殊结构限制了负责基本生命过程的蛋白质与围绕组蛋白上的DNA接触,所以它的形成以及在染色质上的精确定位在基因表达过程中起着无可替代的作用,直接或间接地影响转录等基本生物过程。核小体定位是真核生物基因转录调节的重要方式,要彻底了解基因表达调控信息,就必须考虑核小体定位的调控作用,核小体的位置信息与基因表达调控的关系是当前表观遗传学的研究热点,因此提供一个快速、准确的核小体分类十分必要。
然而,通过生物学的方法来测定核小体定位非常困难,并且效率较低。因此应用生物信息学的相关知识,使用计算机预测技术来测定核小体定位就显得尤为重要,对于发现和认识核小体结构和生理功能有着重要的意义。
目前,针对核小体定位的计算模型还很欠缺。查阅文献,可以发现,目前为数不多专门设计用来进行核小体定位预测的计算模型,iNuc-PhysChem和Segal。iNuc-PhysChem基于核小体序列具有一定的位置特异性物理化学识别核小体定位的预测器(Chen W,Lin H,Feng P-M,Ding C,Zuo Y-C,et al.(2012)iNuc-PhysChem:A Sequence-Based Predictorfor Identifying Nucleosomes via Physicochemical Properties.PLoS ONE 7(10):e47843.doi:10.1371/journal..pone.0047843)。另一方面,Segal(School ofElectronics and Information Engineering,SoochowUniversity,Suzhou,215006)通过核小体和连接序列的二核苷酸位置频率建立了核小体和连接序列两组得分函数,并以其差值作为核小体的定位依据。然而,综合分析这两个预测模型,可以发现预测生物物种局限在一种酵母,迫切需要进一步建立一个适应更广泛的生物类型的核小体定位的预测器。基于一种称为“iNuc-PseKNC”(Guo S H,Deng E Z,Xu L Q,et al.iNuc-PseKNC:a sequence-based predictor for predicting nucleosome positioning in genomes with pseudok-tuple nucleotide composition.[J].Bioinformatics,2014,30(11):1522)的预测因子的改进方法预测核小体位置的核心算法,但现有的预测算法大部分仅依据核小体的统计特性,定位准确性很受局限。另一方面,经研究发现,DNA连接序列作为两个核小体的连接纽带,存在一定的统计特性。
发明内容
本发明的目的是针对现有技术的不足,而提供一种基于卷积神经网络的核小体分类预测方法。这种方法能精准预测核小体的分类。
实现本发明目的技术方案是:
一种基于卷积神经网络的核小体分类预测方法,包括如下步骤:
1)特征提取:选取UCSC基因组数据库中智人、线虫和黑腹果蝇三个生物的核小体或链接体的DNA序列,每一段核小体或链接体的DNA序列长度为147bp,bp是指碱基对,通过独热编码依次将每一段核小体或链接体的DNA序列中的二核苷酸ATCG的16种组合方式转化成16维的向量,该特征向量表示如公式(1):
Xi=(Pi,1,Pi,2,...,Pi,16)T (1)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711011644.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种虚拟机迁移的方法及装置
- 下一篇:流量处理方法及装置