[发明专利]一种医疗语料标注方法在审

申请号：	201911107940.X	申请日：	2019-11-13
公开（公告）号：	CN110826304A	公开（公告）日：	2020-02-21
发明（设计）人：	孙广阳;程岚;祝伟	申请（专利权）人：	北京雅丁信息技术有限公司
主分类号：	G06F40/169	分类号：	G06F40/169;G06F40/242;G06F40/279;G06F16/335
代理公司：	北京中企鸿阳知识产权代理事务所(普通合伙) 11487	代理人：	苏艳
地址：	100020 北京市朝***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种医疗语料标注方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提出了一种医疗语料标注方法，包括：注册账号，向用户分配任务；标注界面呈现原始语料，由用户根据原始语料查找到对应的选项进行单选；如果多个选项中没有标准结果，则在选项下输入需要和正规ICD9、ICD10两类编码字典相同；允许用户对选择的结果进行标记；如果语料标注为复合语料，则在拆分界面进行拆分，设置为拆分列表；如果语料标注为正常语料，则设置为正常标注列表，否则设置为丢弃列表；如果语料为不可识别语料，则标注为疑问语料；检查完毕后，确定无误提交任务；分享并导出检查结果。本发明可以将医疗语料规范化，所产生的数据可以为医疗数据的信息化提供便捷的方法，统一的流程，高效的进度。

技术领域

本发明涉及数据处理技术领域，特别涉及一种医疗语料标注方法。

背景技术

在当今医疗逐渐信息化的时代，想要将医疗信息纳入大数据中，就必须标准化起来。因为很多种病名因为太难记，不顺口，医生在录入患者信息时，会将病名简化或者口语化，导致信息的不规范，通用性很差，查询也不方便。病案编码员的工作就是将这些不规范的信息规范化起来，但是人工速度慢，任务量大，而且分类不明确，导致工作效率低。

发明内容

本发明的目的旨在至少解决所述技术缺陷之一。

为此，本发明的目的在于提出一种医疗语料标注方法。

为了实现上述目的，本发明实施例提供一种医疗语料标注方法，包括如下步骤：步骤S1，注册账号，向用户分配任务，其中，分配的任务包括ICD9、ICD10两类，分配指定数量；用户登录到标注界面，选择标注ICD9或ICD10的任务；

步骤S2，标注界面呈现原始语料，由用户根据原始语料查找到对应的选项进行单选；

步骤S3，在标注过程中，如果多个选项中没有标准结果，则在选项下输入需要和正规ICD9、ICD10两类编码字典相同；允许用户对选择的结果进行标记，其中，标记状态包括：复合语料、正常语料、疑问语料；

步骤S4，如果语料标注为复合语料，则在拆分界面进行拆分，设置为拆分列表；如果语料标注为正常语料，则设置为正常标注列表，否则判断语料为无用语料，设置为丢弃列表；如果语料为不可识别语料，则标注为疑问语料；

步骤S5，当用户完成标注任务后，在检查界面对已标注过的内容进行检查，在检查界面查看正常标注列表、拆分列表、疑问列表、丢弃列表，在检查过程中进行重新选择和重新拆分；

步骤S6，检查完毕后，确定无误提交任务，提交的数据对所有数据进行匹配一次，将相同的语料进行自动标注；

步骤S7，将所述疑问列表和丢弃列表进行分享，导出检查结果。

进一步，将数据库中的每条语料，通过NLP算法得出多个最相似的编码形成新的列，将得到的结果作为数据源。

进一步，当检测到语料为复合语料，则进入拆分界面，对这条语料进行拆分，拆分后结果在ICD字典库通过NLP算法进行相似度匹配，查找相似的选项供用户选择，并将拆分后的语料存入数据库。

进一步，对于无用语料，进行丢弃，对于丢弃的语料不直接删除，仅在任务列表中删除，在检查界面确认后删除。

进一步，在标注过程中，向用户提供总任务量和剩余任务栏查看界面。

进一步，在标注过程中，如果用户退出登录，在下次登录时直接显示到当前标注的位置。

进一步，在标注过程中，如果该语料为无用语料，确定后标记为“丢弃”，其中，标记为丢弃的语料不被直接删除，在检查界面进一步检查；如果可以则回收利用重新标记，否则被删除。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京雅丁信息技术有限公司，未经北京雅丁信息技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201911107940.X/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种医疗语料标注方法在审

专利文献下载