[发明专利]一种基于深度学习的中医诊疗知识图谱自动构建方法在审
申请号: | 201910518050.1 | 申请日: | 2019-06-14 |
公开(公告)号: | CN110334211A | 公开(公告)日: | 2019-10-15 |
发明(设计)人: | 李巧勤;郑子强;朱嘉静;巩小强;刘勇国;杨尚明 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36;G06F17/27;G16H20/90 |
代理公司: | 北京众合诚成知识产权代理有限公司 11246 | 代理人: | 马超前 |
地址: | 610054 *** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 病案 中医诊疗 图谱 构建 中医诊疗知识 自动抽取 自动构建 预定义 聚类 学习 中医 命名实体 初始化 多对多 三元组 实体组 语料库 分词 分句 预测 转化 | ||
本发明公开了一种基于深度学习的中医诊疗知识图谱自动构建方法,包括:构建初始化文献病案语料库,对病案进行分句、分词,并对病案中的“理‑法‑方‑药”实体进行标记;通过双向LSTM对实体进行预测,通过深度学习模型从中医文献病案自动抽取实体;将同一病案中出现的同类实体进行聚类形成实体组,然后根据预定义的实体之间的关系形成三元组,构建知识图谱。本发明通过预定义中医诊疗概念之间的关系,将知识图谱的构建转化为中医诊疗命名实体识别任务,通过深度学习模型从中医文献病案自动抽取实体,并将实体进行聚类构成实体集,解决中医诊疗概念之间多对多的问题,完整展现病案中名老中医诊疗思想。
技术领域
本发明涉及一种中医诊疗知识图谱自动构建方法,具体地说,涉及一种基于深度学习的中医诊疗知识图谱自动构建方法。
背景技术
知识图谱是以“语义网络”为骨架构建起来的巨型、网络化的知识系统,旨在描述客观世界的概念、实体、事件及其之间的关系。其中,概念是指人们在认识世界过程中形成对客观事物的概念化表示,如人、动物、组织机构等。实体是客观世界中的具体事物,如篮球运动员姚明、互联网公司腾讯等。事件是客观事件的活动,如地震、买卖行为等。关系描述概念、实体、事件之间客观存在的关联关系,如运动员和篮球运动员之间的关系是概念和子概念的关系等。谷歌于2012年5月推出谷歌知识图谱,并利用其在搜索引擎中增强搜索结果,标志着大规模知识图谱在互联网语义搜索中的成功应用。
知识图谱的关键技术涉及自然语言处理、数据挖掘和信息检索等多个领域,主要分为知识驱动和数据驱动两类,随着大数据的发展,基于数据驱动的知识图谱构建方法得到了广泛应用,如法律、社交网络、医疗知识图谱等。“中医药学语言系统(TCMLS)”是以本体(Ontology)和语义网络的技术理念构建的大型语言系统,包含10余万个中医概念以及100余万个语义关系,通过中医药工作者已建立的相对完整的数据库体系,涵盖疾病、中药、方剂、中药化学成分等,为填充中医药知识图谱提供了数据资源,在规模和完整性等方面都处于中医界的领先地位。
“中医药学语言系统(TCMLS)”主要基于已有结构化数据进行知识图谱的构建,而中医文献、书籍等知识载体均为非结构化文本,TCMLS无法利用自由文本(叙述性语言)进行知识图谱的自动构建和扩充;TCMLS形成的知识图谱表现形式为<实体,关系,实体>,而在中医诊疗理论中,概念之间存在多对多的关系,如证候和症状,表现形式应为<症状集,关系,证候集>,因此TCMLS无法完整展现中医诊疗理论。
发明内容
本发明的目的是提供一种基于深度学习的中医诊疗知识图谱自动构建方法,预定义中医诊疗概念之间的关系,通过深度学习的方法从中医文献病案中自动抽取实体,形成诊疗知识图谱,完整展现名老中医的诊疗思想。
为了解决上述技术问题,本发明公开了一种基于深度学习的中医诊疗知识图谱自动构建方法,具体步骤包括:
步骤1,构建初始化文献病案语料库,对病案进行分句、分词,并对病案中的“理-法-方-药”实体进行标记;
步骤2,通过双向LSTM对实体进行预测,通过深度学习模型从中医文献病案自动抽取实体;
步骤3,将同一病案中出现的同类实体进行聚类形成实体组,然后根据预定义的实体之间的关系形成三元组,构建知识图谱。
进一步地,步骤1中构建以下数据结构:
语料库:从中国知网CNKI下载中医文献,从中抽取病案,取75%作为训练集,25%作为测试集,分别用于训练模型参数和测试模型效果;
训练语料库中对“理-法-方-药”实体进行标记,使用“中药-med”、“方剂-pres”、“治法-treat”、“证候-syn”、“症状-sym”一一对应的标记方法,其余不相关的文本使用“O”标记;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910518050.1/2.html,转载请声明来源钻瓜专利网。