[发明专利]一种组织特异性基因及调控因子数据存储方法无效
申请号: | 201010160978.6 | 申请日: | 2010-04-30 |
公开(公告)号: | CN101847181A | 公开(公告)日: | 2010-09-29 |
发明(设计)人: | 赵菲菲;宫秀军;刘新觅 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00;G06F17/30 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李素兰 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种组织特异性基因及调控因子数据存储方法,通过建立包括组织库、基因库、基因别名库、组织特异性基因库及组织特异性基的组织库的组织特异性基因及调控因子数据库来实现数据存储,该方法包括以下步骤:利用文献挖掘的形式在Pubmed文献数据库抽取出组织特异性基因;将查到的组织信息添加到组织库中;利用基因的名字在EMBL、Genebank、NCBI中检索基因的信息,并把此信息添加到基因库对应的条目中;利用从Transfac、EPD及compel数据库中查找基因的调控信息生成基因调控因子XML文件;与现有技术相比,本发明能够使利用现代计算技术挖掘基因表达及调控网络织组特异性内在机制的研究者,方便获取组织特异性基因序列及相应调控因子的数据,充分利用组织特异性基因分析工具,提高研究的质量和效率。 | ||
搜索关键词: | 一种 组织 特异性 基因 调控 因子 数据 存储 方法 | ||
【主权项】:
一种组织特异性基因及调控因子数据存储方法,通过建立包括组织库、基因库、基因别名库、组织特异性基因库及组织特异性基的组织库的组织特异性基因及调控因子数据库来实现数据存储,该方法包括以下步骤:利用文献挖掘的形式在医学文献数据库抽取出组织特异性基因;将查到的组织信息添加到组织库中;利用基因的名字在DNA数据库、核酸以及蛋白质序列、基因序列、蛋白序列功能性数据库中检索基因的信息,并把此信息添加到基因库对应的条目中;利用从转录因子、它们在基因组上的结合位点和与DNA结合的profiles的数据库、真核生物启动子数据库及复合元件数据库中查找基因的调控信息生成基因调控因子XML文件;其中,组织库包括数据库中所有组织信息,内容包括自增型变量的唯一组织代码、组织的名字、组织的类别和组织的描述;基因库包括数据库中所有组织特异性的基因信息,内容包括自增型变量的唯一基因代码、基因的名字、基因对应的调控因子xml文件和基因的核酸序列;基因别名库中存储关于基因库中每个基因的全部或部分别名;组织特异性基因库把组织库中的组织和对此组织有特异性表达的基因相关联,内容包括组织基因的自增型变量的唯一关联关系代码、对应组织库中的自增型变量的唯一组织代码、对应基因库中的自增型变量的唯一基因代码、关联关系的描述、验证此关联关系在pmd中文章的代码pmd_idhe和对应此基因在此组织中的表达量;组织特异性基因库中的每个条目都分别对应一个基因调控因子XML文件,该文件的访间路径被存储在基因库中,该文件用于描述基因在组织中的所有调控因子信息,包括转录起始点的类型及在此基因核酸序列中的位置、转录因子绑定位点在此核酸序列中的位置、转录因子的功能描述、特异性的调控此组织特异性基因表达的所有加强子(enhancer)在此核酸系列中的位置、长度及功能描述,特异性的调控此组织特异性基因表达的所有沉默子(sliencer)在此核酸系列中的位置、长度及功能描述,基因转录控制区域模式特征,转录因子对基因转录的调控机制。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201010160978.6/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用