[发明专利]数据处理方法、装置、电子设备及计算机可读介质有效
| 申请号: | 201810589596.1 | 申请日: | 2018-06-08 |
| 公开(公告)号: | CN108920453B | 公开(公告)日: | 2023-03-24 |
| 发明(设计)人: | 季思伟;张子锐;宋海波;李馨龄 | 申请(专利权)人: | 国家食品药品监督管理总局药品评价中心;医渡云(北京)技术有限公司 |
| 主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/30;G06F40/253;G06F40/247 |
| 代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 阚梓瑄;王卫忠 |
| 地址: | 100022 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 数据处理 方法 装置 电子设备 计算机 可读 介质 | ||
1.一种数据处理方法,其特征在于,包括:
获取待处理数据,所述待处理数据中包括医学词汇;
将所述待处理数据进行分词处理,生成多个分词词汇,通过所述多个分词词汇生成医学词汇集合,其中,进行分词处理的方法包括统计分词法、理解分词法和字符串匹配法中的至少一种;
将所述词汇集合与标准词汇集合进行比较,确定所述待处理数据的标签,所述标准词汇集合中包括结构化词表,所述标准词汇集合通过ICH国际医学用语词典中的标准词生成;以及
根据所述标签对所述待处理数据进行ICH国际医学用语词典编码处理;
所述词汇集合中包括一个主诊断词与至少一个属性词,其中,所述主诊断词为诊断中的核心病症描述词,所述属性词包括方位、主解剖部位、次级解剖部位、分型、遗传学异常、TNM、分期、病理、转移、治疗、程度、状态、合并症和并发症,所述主诊断词与至少一个属性词构成结构化词表,所述将所述词汇集合与标准词汇集合进行比较,以确定所述待处理数据的标签包括:
将所述词汇集合中的主诊断词与标准词汇集合中的主诊断词进行比较,确定所述待处理数据的主类别;以及
将所述词汇集合中的属性词与标准词汇集合中主类别下的属性词进行比较以确定所述待处理数据的标签。
2.如权利要求1所述的方法,其特征在于,还包括:
将ICH国际医学用语词典中的标准词进行分词处理,以生成标准词汇集合。
3.如权利要求1所述的方法,其特征在于,所述字符串匹配法中的机器词典包括:
ICH国际医学用语词典中的标准词;以及
医学专业词汇。
4.一种数据处理装置,其特征在于,包括:
数据模块,用于获取待处理数据,所述待处理数据中包括医学词汇;
第一分词模块,用于将所述待处理数据进行分词处理,生成多个分词词汇,通过所述多个分词词汇生成医学词汇集合,其中,进行分词处理的方法包括统计分词法、理解分词法和字符串匹配法中的至少一种;
比较模块,用于将所述词汇集合与标准词汇集合进行比较,确定所述待处理数据的标签,所述标准词汇集合中包括结构化词表,所述标准词汇集合通过ICH国际医学用语词典中的标准词生成;以及
编码模块,用于根据所述标签对所述待处理数据进行ICH国际医学用语词典编码处理;
所述词汇集合中包括一个主诊断词与至少一个属性词,其中,所述主诊断词为诊断中的核心病症描述词,所述属性词包括方位、主解剖部位、次级解剖部位、分型、遗传学异常、TNM、分期、病理、转移、治疗、程度、状态、合并症和并发症,所述主诊断词与至少一个属性词构成结构化词表,所述将所述词汇集合与标准词汇集合进行比较,以确定所述待处理数据的标签包括:将所述词汇集合中的主诊断词与标准词汇集合中的主诊断词进行比较,确定所述待处理数据的主类别;以及将所述词汇集合中的属性词与标准词汇集合中主类别下的属性词进行比较以确定所述待处理数据的标签。
5.如权利要求4所述的装置,其特征在于,还包括:
第二分词模块,用于将ICH国际医学用语词典中的标准词进行分词处理,以生成标准词汇集合。
6.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-3中任一所述的方法。
7.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-3中任一所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家食品药品监督管理总局药品评价中心;医渡云(北京)技术有限公司,未经国家食品药品监督管理总局药品评价中心;医渡云(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810589596.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种信息处理方法及装置
- 下一篇:一种主题短语抽取方法





