[发明专利]一种基因序列与专利整合关联的方法与系统在审
申请号: | 201710303974.0 | 申请日: | 2017-05-03 |
公开(公告)号: | CN108804461A | 公开(公告)日: | 2018-11-13 |
发明(设计)人: | 陈恒;刘延淮;陈成材;张永娟;张丽雯;陈涛 | 申请(专利权)人: | 中国科学院上海生命科学研究院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F19/22 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 施浩 |
地址: | 200031 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 整合 基因序列 关联 干细胞 检索 生物技术 基因序列相似性 文本挖掘 相关基因 信息服务 专利基因 序列库 构建 | ||
1.一种基因序列与专利整合关联的方法,其特征在于,包括:
步骤1:基于干细胞生物技术专利知识数据库,借助干细胞相关的基因文本挖掘工具字典实现干细胞生物技术专利知识数据库中的基因文本和相关专利的挖掘和发现,生成包含了已被挖掘标记的基因和已被挖掘标记的基因相关专利及其对应关系的干细胞生物技术专利知识数据仓库;
步骤2:基于所生成的干细胞生物技术专利知识数据仓库,借助于基因序列数据库和基因序列相似性检索,将数字序号标识过的一系列相似性基因序列和干细胞生物技术专利知识数据仓库进行整合关联,生成基因序列与干细胞生物技术专利的整合关联关系。
2.根据权利要求1所述的基因序列与专利整合关联的方法,其特征在于,步骤1进一步包括:
步骤a:构建干细胞生物技术专利知识数据库和干细胞相关的基因文本挖掘工具字典;
步骤b:以已构建的干细胞相关的基因文本挖掘工具字典为依据,以干细胞生物技术专利知识数据库中的干细胞相关基因名词为挖掘和发现对象,进行基因文本挖掘和高亮显示;
步骤c:去除数据挖掘和信息整合结果中的非法信息。
3.根据权利要求2所述的基因序列与专利整合关联的方法,其特征在于,在步骤a中,基因文本挖掘工具字典中的每个基因名词前用数字序号进行标识。
4.根据权利要求3所述的基因序列与专利整合关联的方法,其特征在于,在步骤b中,使干细胞生物技术专利知识数据库中的基因名词及专利号与干细胞生物技术专利相关的基因序列数据库的规范数字序号进行一一对应的整合和关联。
5.根据权利要求4所述的基因序列与专利整合关联的方法,其特征在于,在步骤c中,去除非法信息包括去除假阳性基因挖掘结果。
6.根据权利要求5所述的基因序列与专利整合关联的方法,其特征在于,步骤2进一步包括:
步骤d:构建干细胞生物技术专利相关的基因序列数据库;
步骤e:将已构建的基因序列数据库转变为BLAST数据库;
步骤f:进行基因序列相似性检索;
步骤g:根据基因序列数据库提供的协议将标识过的数字序号转换成超链接信息,以实现基因序列与干细胞生物技术专利的信息整合与关联。
7.根据权利要求6所述的基因序列与专利整合关联的方法,其特征在于,步骤d中,通过对干细胞生物技术专利和相关基因的学习和理解,从干细胞生物技术专利知识数据库中提取干细胞相关的基因名词,并在NCBI的基因银行中搜索和收集该基因相关的参数和注释,按照国家知识产权局颁布的专利文献领域核苷酸序列表电子文件标准,进行基因序列数据库的编撰和构建。
8.根据权利要求7所述的基因序列与专利整合关联的方法,其特征在于,在步骤f中,在核酸序列检索框中输入被检的基因序列,通过BLAST算法完成基因序列的相似性搜索和比对,得到一系列相似性的基因序列,其中每一个基因序列都有一个数字序号标识。
9.一种基因序列与专利整合关联的系统,其特征在于,包括:
干细胞生物技术专利知识数据库服务器,用于存储干细胞生物技术专利知识数据库和专利信息知识挖掘程序;
干细胞相关基因序列数据库服务器,用于存储干细胞相关的基因序列数据库和整合关联程序;
其中专利信息知识挖掘程序在干细胞生物技术专利知识数据库服务器上运行执行以下的处理:基于干细胞生物技术专利知识数据库,借助干细胞相关的基因文本挖掘工具字典实现干细胞生物技术专利知识数据库中的基因文本和相关专利的挖掘和发现,生成包含了已被挖掘标记的基因和已被挖掘标记的基因相关专利及其对应关系的干细胞生物技术专利知识数据仓库;
其中整合关联程序在干细胞相关基因序列数据库服务器上运行执行以下的处理:基于所生成的干细胞生物技术专利知识数据仓库,借助于基因序列数据库和基因序列相似性检索,将数字序号标识过的一系列相似性基因序列和干细胞生物技术专利知识数据仓库进行整合关联,生成基因序列与干细胞生物技术专利的整合关联关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院上海生命科学研究院,未经中国科学院上海生命科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710303974.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于SQL的查询语言
- 下一篇:一种广告推荐方法、装置及服务器