[发明专利]上市药品信息标准化方法、设备、服务器及存储介质在审
申请号: | 202010002703.3 | 申请日: | 2020-01-02 |
公开(公告)号: | CN111180087A | 公开(公告)日: | 2020-05-19 |
发明(设计)人: | 朱彦;刘丽红;贾李蓉;刘静;高博;陈超;聂莹;乔幸潮 | 申请(专利权)人: | 中国中医科学院中医药信息研究所 |
主分类号: | G16H70/40 | 分类号: | G16H70/40;G06F40/289 |
代理公司: | 北京北汇律师事务所 11711 | 代理人: | 李英杰 |
地址: | 100700 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 上市 药品信息 标准化 方法 设备 服务器 存储 介质 | ||
1.一种对上市药品信息进行标准化的方法,其特征在于,包括:
从药品标准中采集药品标准数据;
对所采集的药品标准数据进行结构化处理来形成经结构化处理的药品标准数据;
采集药品数据,所述药品数据包括药品名称和批准文号;
将所采集的药品数据在经结构化处理的药品标准数据中进行匹配;以及
在成功匹配的情况下,在网络上自动检索与所述药品数据相对应的药品说明书,并且将所采集的药品数据和所采集的药品说明书相关联地存储在经结构化处理的药品信息数据库中的对应条目中。
2.根据权利要求1所述的方法,其特征在于,所述对所采集的药品标准数据进行结构化处理来形成经结构化处理的药品标准数据进一步包括:
对采集的药品标准数据的粗文本进行校对,得到标准数据的精校文本;以及
从精校文本中提取与以下各项中的一项或多项字段相对应的信息,形成经结构化处理的药品标准数据:正式名称、别名、拼音名、英文名、药品类型标识、标准来源书籍、标准编号、处方、制法、性状、鉴别、检查、功能与主治、类别、用法与用量、规格、贮藏方法,
其中所述提取使用正则表达式方法。
3.根据权利要求2所述的方法,其特征在于,所述对所采集的药品标准数据进行结构化处理来形成经结构化处理的药品标准数据进一步包括:
整理采集到的药品标准数据,其中如果采集到的药品标准数据是图像格式,则对图像格式的药品标准数据进行OCR自动识别,得到药品标准数据的文本格式的粗文本。
4.根据权利要求2所述的方法,其特征在于,所述药品标准数据的精校文本的处方字段对应的信息是一段自由文本,所述对所采集的药品标准数据进行结构化处理来形成经结构化处理的药品标准数据进一步包括:
将所述自由文本中的物质、剂量和单位抽取出来,并利用物质术语表、剂量术语表和单位术语表来进行标准化,具体包括:
准备物质表、剂量表和单位表;以及
对所述自由文本进行中文分词,识别出多个“物质-剂量-剂量单位”单元。
5.根据权利要求1-4中任一项所述的方法,其特征在于,还包括:
在未能成功匹配的情况下,更新所述经结构化处理的药品标准数据;和/或,
所述将所采集的药品数据和所采集的药品说明书相关联地存储在经结构化处理的药品信息数据库中的对应条目中进一步包括:将所采集的药品说明书和经结构化处理的药品信息数据库中的对应条目这二者中预设字段所对应的信息进行再次匹配,只有所述在此匹配成功的情况下,才将将所采集的药品数据和所采集的药品说明书相关联地存储在经结构化处理的药品信息数据库中的对应条目中,否则,更新所述经结构化处理的药品标准数据。
6.一种对上市药品信息进行标准化的设备,其特征在于,包括:
药品标准数据采集装置,用于从药品标准中采集药品标准数据;
结构化处理装置,用于对所采集的药品标准数据进行结构化处理来形成经结构化处理的药品标准数据;
药品数据采集装置,用于采集药品数据,所述药品数据包括药品名称和批准文号;
匹配装置,用于将所采集的药品数据在经结构化处理的药品标准数据中进行匹配;以及
药品说明书检索装置,用于在成功匹配的情况下,在网络上自动检索与所述药品数据相对应的药品说明书,并且将所采集的药品数据和所采集的药品说明书相关联地存储在经结构化处理的药品信息数据库中的对应条目中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国中医科学院中医药信息研究所,未经中国中医科学院中医药信息研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010002703.3/1.html,转载请声明来源钻瓜专利网。