[发明专利]一种蛋白质自相互作用的预测方法有效
| 申请号: | 201711062661.7 | 申请日: | 2017-11-02 |
| 公开(公告)号: | CN107609352B | 公开(公告)日: | 2020-07-28 |
| 发明(设计)人: | 陈沾衡;尤著宏;李晓;蒋同海;王延斌;方昱斌;陈沾兴 | 申请(专利权)人: | 中国科学院新疆理化技术研究所 |
| 主分类号: | G16B40/00 | 分类号: | G16B40/00;G16B25/00 |
| 代理公司: | 乌鲁木齐中科新兴专利事务所(普通合伙) 65106 | 代理人: | 张莉 |
| 地址: | 830011 新疆维吾尔*** | 国省代码: | 新疆;65 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种蛋白质自相互作用的预测方法,该方法包括数据集的选择与建立,PSSM矩阵的生成,傅里叶描述子提取特征值,训练集和测试集的构建,分类器模型构建步骤完成,该方法是利用傅里叶描述子提取样本集的特征值,使计算机计算数据集的离散傅里叶变换所需的乘法次数大为减少,也节省了计算量;本发明能够利用随机投影的方法构建模型,大大提高了预测精度,能够得到比较好的预测效果;本发明方法计算代价低,功耗小;可以有效地预测蛋白质的自相互作用,预测效果可以达到93%以上。 | ||
| 搜索关键词: | 一种 蛋白质 相互作用 预测 方法 | ||
【主权项】:
一种蛋白质自相互作用的预测方法,其特征在于,按下列步骤进行:a、数据集的选择与建立:利用UniProt数据库中的human和yeast两个黄金标准数据集构建预测蛋白质自相互作用的数据集;b、PSSM矩阵的生成:将每一个蛋白质序列的位置都表示为一个M×20的矩阵,其中M代表一种蛋白质残基的数目,矩阵的列代表了20种氨基酸,通过使用BLAST的位置特异性PSI‑BLAST将每个蛋白质都转换成PSSM矩阵;c、傅里叶描述子提取特征值:将步骤b中每一个蛋白质转换的PSSM转置矩阵与原PSSM矩阵进行相乘,这样每个蛋白质序列被转化为一个20×20的矩阵,然后计算矩阵的傅里叶描述子,再计算傅里叶的逆描述子,最终每一个蛋白质提取出20×2个特征值;d、训练集和测试集的构建:利用放回抽样方式对样本进行抽样,将human和yeast的阴阳数据集构造成均衡数据集,然后组成用于模型构建的数据集,以数量比4:1随机切割数据集得到训练集和测试集,然后进行5折交叉验证;e、分类器模型构建:利用高维空间中的随机投影方式构建分类器的训练模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院新疆理化技术研究所,未经中国科学院新疆理化技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711062661.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种基于卷积神经网络预测假尿苷修饰位点的方法
- 下一篇:一种软件加密装置





