[发明专利]一种实体链接方法及装置有效
申请号: | 202010177062.5 | 申请日: | 2020-03-13 |
公开(公告)号: | CN111462914B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 史亚飞 | 申请(专利权)人: | 云知声智能科技股份有限公司 |
主分类号: | G16H50/70 | 分类号: | G16H50/70;G06F40/295;G06F40/30;G06F40/194 |
代理公司: | 北京冠和权律师事务所 11399 | 代理人: | 张楠楠 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 实体 链接 方法 装置 | ||
1.一种实体链接方法,其特征在于,包括:
获取医疗知识图谱;
通过图嵌入模型对医疗知识图谱进行计算,以得到若干个不同的实体嵌入向量;
基于所述若干个不同的实体嵌入向量,确定实体链接模型;
根据所述实体链接模型完成医疗实体的链接;
所述根据所述实体链接模型完成医疗实体的链接,包括:
从医疗数据集中抽取医疗术语;
通过预设检索算法对所述医疗知识图谱进行检索,以得到与所述医疗术语相似度大于预设阈值的预设数目个第二医疗实体;
基于所述实体链接模型,对所述预设数目个第二医疗实体进行链接,以完成医疗实体的链接;
所述基于所述实体链接模型,对所述预设数目个第二医疗实体进行链接,包括:
通过所述实体链接模型对所述预设数目个第二医疗实体进行计算,以得到所述预设数目个第二医疗实体相互之间进行匹配的分值;
将所述预设数目个第二医疗实体按照相互之间进行匹配的分值的最高值进行链接;
所述基于所述若干个不同的实体嵌入向量,确定实体链接模型,包括:
获取训练数据集;
通过预设算法对所述训练数据集进行解析,以得到训练数据集的语义成分;
其中,预设算法为Bert+BiLSTM+CRF算法;
从所述医疗知识图谱中匹配出与所述语义成分对应的第一医疗实体;
从所述若干个不同的实体嵌入向量中提取出与所述第一医疗实体对应的实体嵌入向量;
基于所述第一医疗实体对应的实体嵌入向量,确定所述实体链接模型;
所述基于所述第一医疗实体对应的实体嵌入向量,确定所述实体链接模型,包括:
获取预训练模型;
其中,预训练模型为BERT模型;
将所述第一医疗实体对应的实体嵌入向量与所述预训练模型本身的tokenembedding、position embedding、segment embedding进行结合,以得到增强的embedding;
通过微调的方式,将所述增强的embedding输入至所述预训练模型进行训练,以得到所述实体链接模型。
2.一种实体链接装置,其特征在于,包括:
获取模块,用于获取医疗知识图谱;
计算模块,用于通过图嵌入模型对医疗知识图谱进行计算,以得到若干个不同的实体嵌入向量;
确定模块,用于基于所述若干个不同的实体嵌入向量,确定实体链接模型;
链接模块,用于根据所述实体链接模型完成医疗实体的链接;
抽取子模块,用于从医疗数据集中抽取医疗术语;
检索子模块,用于通过预设检索算法对所述医疗知识图谱进行检索,以得到与所述医疗术语相似度大于预设阈值的预设数目个第二医疗实体;
链接子模块,用于基于所述实体链接模型,对所述预设数目个第二医疗实体进行链接,以完成医疗实体的链接;
计算单元,用于通过所述实体链接模型对所述预设数目个第二医疗实体进行计算,以得到所述预设数目个第二医疗实体相互之间进行匹配的分值;
链接单元,用于将所述预设数目个第二医疗实体按照相互之间进行匹配的分值的最高值进行链接;
所述确定模块,包括:
获取子模块,用于获取训练数据集;
解析子模块,用于通过预设算法对所述训练数据集进行解析,以得到训练数据集的语义成分;
其中,预设算法为Bert+BiLSTM+CRF算法;
匹配子模块,用于从所述医疗知识图谱中匹配出与所述语义成分对应的第一医疗实体;
提取子模块,用于从所述若干个不同的实体嵌入向量中提取出与所述第一医疗实体对应的实体嵌入向量;
确定子模块,用于基于所述第一医疗实体对应的实体嵌入向量,确定所述实体链接模型;
所述确定子模块,包括:
获取单元,用于获取预训练模型;
其中,预训练模型为BERT模型;
结合单元,用于将所述第一医疗实体对应的实体嵌入向量与所述预训练模型本身的token embedding、position embedding、segment embedding进行结合,以得到增强的embedding;
训练单元,用于通过微调的方式,将所述增强的embedding输入至所述预训练模型进行训练,以得到所述实体链接模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司,未经云知声智能科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010177062.5/1.html,转载请声明来源钻瓜专利网。