[发明专利]一种基于文献中化合物数据的提取与管理方法及系统在审
申请号: | 202211691942.X | 申请日: | 2022-12-28 |
公开(公告)号: | CN116092601A | 公开(公告)日: | 2023-05-09 |
发明(设计)人: | 刘庭海 | 申请(专利权)人: | 星希尔生物科技(上海)有限公司 |
主分类号: | G16C20/90 | 分类号: | G16C20/90;G16C20/80;G16C20/70;G06F16/55;G06F16/35;G06F16/9535 |
代理公司: | 北京中南长风知识产权代理事务所(普通合伙) 11674 | 代理人: | 穆丽红 |
地址: | 200131 上海市浦东新区中国*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 文献 化合物 数据 提取 管理 方法 系统 | ||
本发明公开了一种基于文献中化合物数据的提取与管理方法,包括:用户初步搜集、整理并通过Chrome浏览器访问MIS平台系统上传文献资料;根据文献资料的类型进行药化信息识别;将药化信息和区域数据通过分类存储数据库归类存储;分类存储数据库用于根据药化信息和区域数据的数据类型特征建立索引形成经验数据,从而便于基于经验数据高效进行数据检索;基于经验数据,进行数据特征的分析学习并生成新的化学数据,将新的化学数据提供给用户。还公开对应系统及应用。克服传统工作方式局限性,方便数据管理追溯,为新型药物小分子的发现与设计带来极大便利,降低相关工作人员对领域知识依赖,提高新型药物设计和开发效率,缩短研发周期,具有较高实用价值。
技术领域
本发明属于生物基因和人工智能药物研究技术领域,尤其涉及一种基于文献中化合物数据的提取与管理方法及系统。
背景技术
药物分子合成与优化领域中,很多情况下需要基于历史文献资料做分析研究。在庞大的文献资料情况下,如何提高调研、数据分析的效率显得至关重要。传统的方法通常是药化专家在阅读大量文献数据过程中人工识别认为有意义的数据,通过纯人工的方式来收录和保存数据。这种方法效率非常低,而且这个过程非常依赖于药化学家的领域知识和经验,不方便索源,效率低,在数据转化的过程中工作量庞大,很难快速推进调研和分析的速度,分析的结果数据如果想和AI相结合进一步分析,难度也比较高,整个流程也变得效率极为低下。
目前在药物研发过程中,会分析大量的历史经验数据,常见的数据提取方式是通过文献资料,找到有意义的药化数据,通过参考分析,来提高研发效率,如:SMILES数据,药化专家通过归纳、分类,转换相应的化学结构,提取其中有意义的数据信息,然后药化专家在此基础上做进一步的分析、泛化。这种传统的技术调研、数据分析的方式不仅效率低下,而且后续信息索源方面非常困难,在当今的大数据时代,很难快速的推进,同时在信息整理的全过程全人工参与,不方便团队协作,效率低下且很容易犯错误。
因此,上述的现有技术确实有待提出更佳解决方案的必要性。
发明内容
针对以上现有技术中的不足,提供一种基于文献中化合物数据的提取与管理方法及系统,基于MIS系统结合AI,全方位管理数据,支持全方位的药物研发过程中文献数据的挖掘、收集和提取,支持数据结合AI的智能分析、索源,极大的提高药物研发的效率,同时为了适应当前移动互联网的发展可以将MIS系统支持多端适配,极大的拓展了使用场景,另外基于MIS系统和AI智能对接,可以高效实现数据的快速泛化、新药化数据的推理及生成,从而提高研发效率,为整个药物研发缩短了周期。AI的全程参与也拓展了药化专家的思路,为药物研发提供了无限的可能。
本发明一方面提供了一种基于文献中化合物数据的提取与管理方法,基于Chrome浏览器访问使用,包括:
S1,用户初步搜集、整理并通过Chrome浏览器访问MIS平台系统上传文献资料;
S2,MIS平台系统根据所述文献资料的类型进行药化信息识别;
S3,将所述药化信息和所述区域数据通过分类存储数据库归类存储;其中所述分类存储数据库用于根据所述药化信息和所述区域数据的数据类型特征建立索引形成经验数据,从而便于基于所述经验数据高效进行数据检索;
S4,基于所述经验数据,进行数据特征的分析学习并生成新的化学数据,将所述新的化学数据提供给所述用户。
优选的,所述文献资料的类型包括图片类文献资料和PDF类文献资料。
优选的,所述S2包括:
S21,对于图片类文献资料,所述MIS平台系统基于自动识别模块识别所述图片内的药化信息并转存,实现服务端自动转换处理以及后续方便溯源;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于星希尔生物科技(上海)有限公司,未经星希尔生物科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211691942.X/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置