[发明专利]族性化学结构标引系统和标引方法有效
申请号: | 200710303862.1 | 申请日: | 2007-12-26 |
公开(公告)号: | CN101196963A | 公开(公告)日: | 2008-06-11 |
发明(设计)人: | 徐峻;刘延淮;王新毅 | 申请(专利权)人: | 北京时代楷模科技有限公司 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100083北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 化学 结构 标引 系统 方法 | ||
技术领域
本发明涉及一种化学结构尤其是族性化学结构的标引系统和标引方法,特别涉及在建立化学结构尤其是族性化学结构数据库时的标引系统和标引方法。
背景技术
1924年,美国的Eugene Markush先生申请的一篇染料专利,被授予了美国专利。Markush先生首先使用族性化学结构表达方法来代表具有相同母体结构但取代基可变化的一组化合物,用以扩大其申报专利的保护范围。此后,在化学领域的专利文献中常会看到包含有用Rn表示特性的族性化学结构,这种结构被后人统称为Markush结构。Markush结构的出现使得化学专利尤其是药物专利的成果保护上了一个新台阶。早在上世纪50年代,众多科学家就开始对在计算机上处理Markush结构展开了大量研究,但由于此类结构具有可变结构属性,结构表述本身具有歧义性,这给计算机处理带来非常高的难度,因此真正实现商业化应用的成果很少。直到目前,世界上也只有屈指可数的几家公司,例如英国德温特公司(Derwent)、法国DARC公司和美国化学文摘社(CAS)等拥有对Markush结构进行计算机检索的实用技术,而且其技术处在严格保密之中。世界著名化学信息处理公司MDL近年推出的ISIS系列产品,具有结构输入功能,但该系列产品是为了确定结构的输入而设计的,并不适合表达复杂的族性化学结构逻辑体系,标引人员用其勉强标引族性化学结构,发生输入出错率高,难以纠错,兼容性差和培训困难等问题,且从数据库读回复杂的族性化学结构时,图像扭曲、失真严重,几乎无法对错误的标引结果进行修改。
Markush结构的标引的基本原理是:(1)首先分析专利例如药物专利、化学专利中的化学结构及其语言描述;(2)从中提取最主要的化学结构片段作为整个Markush结构的骨架结构;(3)在骨架结构上用RGroup原子来代表一类可变基团,其中RGroup原子称为Rn原子,是由字母R与数字1到32组成的32个特殊的原子符号之一,例如R1、R2、R19;(4)为每一种RGroup定义取代基团,同样取代基团上可以继续连接RGroup原子;(5)在每一个取代基团上设置连接点,以标示出与骨架结构的连接位置;(6)定义RLogic,其中RLogic是由一个或多个对RGroup进行限定的描述字符串组成的一组符号;(7)把绘制的分子结构以连接表的形式保存在存储设备中。
为了解决上述难点,实现Markush结构的顺利标引和检索,需要提供一种适合于复杂Markush结构的,能够自动纠错的Markush标引系统和标引方法,以适应日趋复杂的Markush结构的专利文献与科技文献的采集、管理、检索与输出,提高标引输入的结构适应性、标引的正确性、标引效率以及检索的准确性。
发明内容
本发明旨在提供一种可对复杂的族性化学结构进行绘图和对标引结果进行计算机存储、检索处理,且操作方便、准确、易于纠错的族性化学结构标引系统和标引方法。
为了达到上述目的,本发明提供一种族性化学结构标引系统,该标引系统通过包括输入设备、显示装置、主存储器、存储设备、处理器和绘图工具完成Markush结构数据的输入、存储、处理和输出。
其中输入设备用于以图形形式输入Markush结构信息。
其中显示装置用于显示图形用户界面及输入结构原始信息和转换后信息的可视化输出。
其中主存储器用于存储执行中的计算机程序,以及绘制Markush结构时的实时数据,数据以二进制序列化形式存于主存储器中。
其中存储设备用于存储计算机程序文件,以连接表形式保存的Markush结构的mol文件和windows位图(微软公司定义的一种图形文件格式)图形文件,以及各种配置文件、临时文件及历史文件。
其中处理器是系统中主要的数据处理设备,用于分析输入设备输入的Markush结构数据,并根据操作指令对Markush结构数据进行添加、删除、修改与转换等处理。
其中绘图工具包括一标引操作主模块,一结构格式处理主模块,一分子结构显示主模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京时代楷模科技有限公司,未经北京时代楷模科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710303862.1/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用