[发明专利]一种医学实体识别方法在审
申请号: | 202110378224.6 | 申请日: | 2021-04-08 |
公开(公告)号: | CN112966515A | 公开(公告)日: | 2021-06-15 |
发明(设计)人: | 沈同平;金力;黄方亮;孟庆全;王元茂;许欢庆 | 申请(专利权)人: | 沈同平 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/284;G06Q10/06 |
代理公司: | 合肥正则元起专利代理事务所(普通合伙) 34160 | 代理人: | 刘汪丹 |
地址: | 230000 *** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 医学 实体 识别 方法 | ||
1.一种医学实体识别方法,其特征在于,包括如下步骤:
步骤一:对待识别的医疗文本进行采集、存储;
步骤二:对采集的医疗文本进行分析,获取得到医疗文本的识别优先表;反馈该医疗文本在识别优先表所处的序列位置至控制中心;所述控制中心按照反馈的序列位置对该医疗文本进行识别;
步骤三:收集医学词典,将其整理为疾病词库、症状词库、检查词库、治疗词库;利用收集到的医学词典通过隐马尔可夫模型对医疗文本进行标注,得到预测分词结果;
步骤四:通过半监督学习过程进行迭代自学习,对预测分词结果进行过滤与校准;选取对应的全科医生进行人工核对、查漏补缺;得到最终的医疗文本的医疗命名实体识别结果。
2.根据权利要求1所述的一种医学实体识别方法,其特征在于,所述步骤一中对待识别的医疗文本进行采集、存储,具体包括:
S11:获取当前时间上班的工作人员并将其标记为初选人员;
S12:将初选人员的入职时间与系统当前时间进行时间差计算得到初选人员的入职时长并标记为SD;
设定初选人员的年龄为SF;设定初选人员的采集次数为SG;
S13:将入职时长、年龄和录入次数进行归一化处理并取其值;
利用公式SZ=(SD×A1+SG×A2-|SF-35|×A3)×ST-1.2356获取得到初选人员的采集值SZ;其中,ST为初选人员的采效值;A1、A2和A3均为预设系数因子;
S14:选取采集值SZ最大的初选人员为采集员;
S15:将采集指令发送至采集员的手机终端上;同时该采集员的采集次数增加一次;
S16:采集员接收采集指令后对待识别的医疗文本进行采集、存储;
将采集结束时刻与采集开始时刻进行时间差计算得到采集员的采集时长,将其标记为TA;设定用户输入的评分值为B;
将采集时长与输入的评分值进行归一化处理并取其值;
利用公式DT=1/TA×b1+B×b2获取得到采集员的单次值,将采集员的所有单次值进行求和并取平均值得到采集员的采效值ST;其中b1和b2均为预设比例系数。
3.根据权利要求1所述的一种医学实体识别方法,其特征在于,所述步骤二中获取得到医疗文本的识别优先表的具体步骤为:
S21:获取医疗文本的生成时间,将生成时间与系统当前时间进行时间差计算得到医疗文本的延时时长,并标记为YT;
S22:采集系统当前时间前三十天内的医疗文本的调阅记录;所述调阅记录包括调阅人、调阅开始时刻和调阅结束时刻;
将医疗文本的调阅次数进行累加形成调阅频次,并标记为P1;
按照调阅人对医疗文本的调阅记录进行排序,统计医疗文本的调阅人数并标记为P2;
将调阅开始时刻与调阅结束时刻进行时间差计算得到调阅时长,将调阅时长进行累加形成调阅总时长,并标记为P3;
对调阅频次、调阅人数和调阅总时长进行权重分配,将调阅频次的权重标记为Z1,将调阅人数的权重标记为Z2,将调阅总时长的权重标记为Z3;其中Z1+Z2+Z3=1;
利用公式QT=P1×Z1+P2×Z2+P3×Z3获取得到医疗文本的调阅吸引值QT;
S23:将医疗文本的调阅记录按照调阅开始时刻进行排序,获取医疗文本最后一次的调阅开始时刻并标记为ZT1;
将医疗文本最后一次的调阅开始时刻与系统当前时间进行时间差计算得到缓冲时长并标记为HT1;
S24:将延时时长、调阅吸引值和缓冲时长进行归一化处理并取其数值;
利用公式YS=YT×Z4+QT×Z5+1/HT1×Z6获取得到医疗文本的优识值QT;其中Z4、Z5和Z6均为预设比例系数;
S25:将医疗文本按照优识值QT的大小进行降序排列生成医疗文本的识别优先表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于沈同平,未经沈同平许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110378224.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于人脸识别的跨境结算用系统
- 下一篇:电池极片的叠片生产线系统