[发明专利]一种基因蛋白质序列关系分析系统及方法无效
申请号: | 201210492701.2 | 申请日: | 2012-11-27 |
公开(公告)号: | CN102968577A | 公开(公告)日: | 2013-03-13 |
发明(设计)人: | 史卫峰;柏佳宁;李先斌;凌诚;郭雪平;郑为民;黄锡鸿 | 申请(专利权)人: | 广州中国科学院先进技术研究所 |
主分类号: | G06F19/16 | 分类号: | G06F19/16 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 谭英强 |
地址: | 511458 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基因 蛋白质 序列 关系 分析 系统 方法 | ||
技术领域
本发明涉及生物技术领域,尤其涉及一种基因蛋白质序列关系分析系统及方法。
背景技术
由于生物数据的复杂性和高维性,既不能以数字公式表示,也不能以逻辑公式表示,故对这些序列的研究大多是基于统计工具。此外,通过数据的可视化,帮助人们认识和理解生物序列,进而分析和解释数据,使人们从表面上看来是杂乱无章的海量数据中找出隐藏的规律,为科学发现提供依据。所以,现在很多学者都开始借助各种可视化工具,以图、树、方体、链的形式展现其复杂结构和序列模式,以求直观地表达生物序列的理论结构与区别。同时,将经过数据挖掘工具得到的数据结果也以图形、图像的形式展现给用户,便于用户寻找数据间的规律和关系。序列的背景信息对于研究序列的进化关系与分类非常关键。然而,目前的工具,均不能利用序列的背景信息和自由选择分析的算法,导致结果的分析与解释不容易进行。而且显示结果只能以一种颜色的方式来表现,用户不能任意改变颜色设置,对用户造成极大的不便。
发明内容
为了解决上述技术问题,本发明的目的是提供一种能自由选择分析算法,并且能更直观地显示结果的一种基因蛋白质序列关系分析系统。
本发明的另一个目的是提供一种能自由选择分析算法,并且能更直观地显示结果的一种基因蛋白质序列关系分析方法。
本发明所采用的技术方案是:
一种基因蛋白质序列关系分析系统,包括:
文件选择模块,用于选择要读取的文件;
序列文件分析模块,用于对序列文件进行分析;
序列距离分析模块,用于计算序列间的距离,得出距离关系矩阵;
MDS分析模块,用于对距离关系矩阵进行分析;
结果显示模块,用于对分析的结果进行分类和显示。
作为所述的一种基因蛋白质序列关系分析系统的进一步改进,所述的序列文件分析模块包括:
文件读取模块,用于读取序列文件;
头文件分析模块,用于将头文件存入数据结构,并对其进行分隔;
字段选择模块,用于选择后续结果显示时需要的字段。
作为所述的一种基因蛋白质序列关系分析系统的进一步改进,所述的MDS分析模块包括:
算法选择模块,用于选择要调用的算法;
降维模块,用于对距离关系矩阵进行降维。
作为所述的一种基因蛋白质序列关系分析系统的进一步改进,所述的结果显示模块包括:
标识选择模块,用于选择标识的形状和颜色;
序列显示模块,用于以选择的形状和颜色标识出各个序列在二维坐标系中的位置;
序列分类模块,用于对序列进行分类。
本发明所采用的另一个技术方案是:
一种基因蛋白质序列关系分析方法,包括以下步骤:
A、选择要读取的文件;
B、对序列文件进行分析;
C、计算序列间的距离,得出距离关系矩阵;
D、对距离关系矩阵进行分析;
E、对分析的结果进行分类和显示。
作为所述的一种基因蛋白质序列关系分析方法的进一步改进,所述的步骤B包括:
B1、读取序列文件;
B2、将头文件存入数据结构,并对其进行分隔;
B3、选择后续结果显示时需要的字段。
作为所述的一种基因蛋白质序列关系分析方法的进一步改进,所述的步骤D包括:
D1、选择要调用的算法;
D2、对距离关系矩阵进行降维。
作为所述的一种基因蛋白质序列关系分析方法的进一步改进,所述的步骤E包括:
E1、选择标识的形状和颜色;
E2、以选择的形状和颜色标识出各个序列在二维坐标系中的位置;
E3、对序列进行分类。
本发明的有益效果是:
本发明一种基因蛋白质序列关系分析系统,通过文件选择模块、序列文件分析模块、序列距离分析模块、MDS分析模块和结果显示模块,选择要读取的文件,对序列文件进行分析,计算序列间的距离,得出距离关系矩阵,对距离关系矩阵进行分析,对分析的结果进行分类和显示,使得用户可以根据需求选择合适的算法进行降维,从而避免损失必要的信息,能单独对序列背景信息进行挖掘和分类,并且提供了多种图形以及丰富的颜色供用户自由选择,从而能更好更直观地显示序列的背景信息。
本发明的另一个有益效果是:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州中国科学院先进技术研究所,未经广州中国科学院先进技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210492701.2/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用