[发明专利]一种基于知识图谱的医保医疗单据审核方法及其系统有效
| 申请号: | 202110663612.9 | 申请日: | 2021-06-16 |
| 公开(公告)号: | CN113360671B | 公开(公告)日: | 2022-04-19 |
| 发明(设计)人: | 俞山青;张建林;甘燃;童天航;傅晨波;宣琦 | 申请(专利权)人: | 浙江工业大学 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/33;G06F40/211;G06F40/295;G06N3/04;G06N5/02;G06Q10/10;G06Q40/08 |
| 代理公司: | 杭州天正专利事务所有限公司 33201 | 代理人: | 王兵 |
| 地址: | 310014 浙*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 知识 图谱 医保 医疗 单据 审核 方法 及其 系统 | ||
1.一种基于知识图谱的医保医疗单据审核方法,包括如下步骤:
1)设计医保审核知识图谱本体图;针对不同医保政策之间的差异性,采用知识图谱本体进行抽象概括,包括参保对象、医保类型、医院等级、地点;医保知识图谱还包括了药品目录详情的医疗知识数据,抽象了“检查方式”,“疾病”,“药物”,“症状”的本体,为患者在治疗过程中的超量用药、重复用药、违规使用无适应症的药品的异常就医行为提供审核依据;
2)构建医保政策句法依存网络;对于医保政策和医疗知识图谱文本中的句子,首先对其进行句法依存分析,并将其转化为对应的网络其中,表示第i个医疗文本序列对应的图网络,V表示网络的词汇节点,E表示图网络词汇节点之间的依存关系;
3)获取依存关系为度的词嵌入特征;基于图网络结构,构建对应的邻接矩阵通过以下公式来聚合不同词汇节点之间的特征:
其中表示第i个文本序列句法依存网络中所有实体的词汇级嵌入特征矩阵,W,b表示网络的训练参数,D表示矩阵的度值矩阵,I为单位矩阵,为输入到模型第l层的词汇的初始特征矩阵,σ为非线性激活函数;
4)聚合词向量与字向量的特征,输入到序列标注层获取实体;把文本预训练好的字向量ec和该字符所在分词的所有一阶词向量ew聚合起来,具体的聚合方式如下:
其中S是句法依存网络中字向量ec所在分词的一阶词向量的集合,其中是集合S中的元素,n是一阶词向量的数量,λ是平衡两种向量权重的超参,λ∈[0,1];
将聚合后的特征e输入到双向神经网络中,提取文本上下文之间的依赖关系;最终,模型的输出为其中表示正向神经网络模型的输出,表示逆向神经网络的输出;
对hi进行序列标注来抽取实体,即给定一组输入序列条件下另一组输出序列的概率,具体公式如下:
y=(y1,y2,...yT) (4)
其中,y表示模型预测的标签;P表示模型输出的分数矩阵,形状为T×k,T表示输入文本序列的长度,k表示预测的标签数量,Pij表示第i个汉字预测的第j个标签的得分;A表示转移分数矩阵,Aij表示第i个标签到第j个标签的转移分数;
最后经softmax层得到所有可能的标签序列的概率,在训练中需要最大化正确标签序列的对数概率,具体公式如下:
log(p(y|X))=s(X,y)-log add(s(X,y)) (5)
其中,p(y|X)表示所有可能的标签序列概率,log add表示对数求和;最终经过序列标注层得到输入文本的序列标签,然后将其组合得到文本中的实体;
5)使用关系抽取算法连接实体并设置关系的时空属性,构建知识四元组,采用的知识图谱建模方式是:得到实体后使用关系抽取方法创建实体之间的关系,并且将知识图谱图谱存储于neo4j图数据库中;对于每份医保政策文件,在抽取出的RDF三元组中额外加入一个知识的时空信息字段形成一个知识四元组,具体格式为行政区号_政策生效的时间戳,即头实体,关系,尾实体,行政区号_政策生效的时间戳,能定位和更新医保政策知识,并能在neo4j中使用关系属性来实现存储;
6)医保政策动态更新;使用新医保政策文件对医保审核知识图谱进行动态实时更新;首先根据当前地点的行政区号快速定位到医保政策知识的四元组,如果新抽取的四元组的时间戳大于图数据库中的时间戳则进行覆盖,使得医保知识图谱中实时保留最新的医疗规则;
7)医疗单据审核;对于医疗单据,需要将单据中的信息识别出来形成结构化数据,即用户的基本信息网络以及就医过程网络;该网络包含患者就医过程中的症状、检查方式、疾病、药物、药物天数、医生六种类型实体组成,不同实体之间存在对应的关系;然后根据当地医院的审核流程定义审核规则,审核过程中需要连接医保政策知识图谱实时查询最新的医保政策进行审核。
2.如权利要求1所述的一种基于知识图谱的医保医疗单据审核方法,其特征在于:步骤2)所述的图网络词汇节点之间的依存关系,包括定中、主谓、动宾。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110663612.9/1.html,转载请声明来源钻瓜专利网。





