[发明专利]一种建立中医药知识图谱的方法在审
申请号: | 201810841115.1 | 申请日: | 2018-07-27 |
公开(公告)号: | CN109063094A | 公开(公告)日: | 2018-12-21 |
发明(设计)人: | 黄伟 | 申请(专利权)人: | 吉首大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G16H20/90 |
代理公司: | 重庆市信立达专利代理事务所(普通合伙) 50230 | 代理人: | 包晓静 |
地址: | 416000 湖南省湘西*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 中医药知识 图谱 数据挖掘模块 检索结果 检索模块 数据采集模块 数据处理模块 可视化操作 准确度 检索意图 结构网络 输出模块 数据采用 推导过程 用户提供 中医知识 数据处理 地组织 采样 求解 检索 处方 分析 关联 输出 期望 改进 | ||
1.一种建立中医药知识图谱的系统,其特征在于,所述建立中医药知识图谱的系统包括:
数据采集模块、数据挖掘模块、数据处理模块、知识图谱输出模块、检索模块;
数据采集模块,与数据挖掘模块连接,用于从传统中医药文献以及临床规范化病案、名中医验案中挖掘提取知识元、样本关系,获取中医药数据库中的原始数据;
数据挖掘模块,与数据采集模块、数据处理模块连接,用于通过数据挖掘构建中医药主题模型网络图;
数据处理模块,与知识图谱输出模块、数据挖掘模块连接,用于通过深度学习器建立复杂网络结构,根据知识元和样本关系构建知识元节点集合及边集合,将关系数据转换成有向权值网络数据;
知识图谱输出模块,与数据处理模块、检索模块连接,用于将知识图谱模型进行可视化地输出;
检索模块,与知识图谱输出模块连接,用于通过关键词检索相应中医药知识信息内容。
2.一种如权利要求1所述的建立中医药知识图谱的方法,其特征在于,所述建立中医药知识图谱的方法包括以下步骤:
步骤一,通过数据采集模块从传统中医药文献以及临床规范化病案、名中医验案中挖掘提取知识元、样本关系,获取中医药数据库中的原始数据;
步骤二,通过数据挖掘模块进行数据挖掘构建中医药主题模型网络图;
步骤三,通过数据处理模块采用深度学习器建立复杂网络结构,根据知识元和样本关系构建知识元节点集合及边集合,将关系数据转换成有向权值网络数据;
步骤四,通过知识图谱输出模块将知识图谱模型进行可视化地输出;
步骤五,通过检索模块输入关键词检索相应中医药知识信息内容。
所述数据采集模块包括数据分类模块,数据分类模块采用贝叶斯算法为:
每个数据元组用一个n维属性向量X={x1,x2,……,xn}表示;
(2)假定有m个类C1,C2,……,Cm,给定某未知类标号的数据元组X,在满足下式公式,贝叶斯分类法将未知的样本X分配给类Ci;
P(Ci|X)>P(Cj|X)1≤j≤m,j≠i;
(3)由于P(X)对于所有类为常数,最大化P(Ci|X),即将先验概率P(X|Ci)P(Ci)最大化;
(4)如果给定一个具体很多属性和元组的训练数据集,计算P(X|Ci)的开销就会非常大,一般假定各属性值有条件地相互独立,这样先验概率可以通过下式从训练数据集求得:P(X1|Ci),P(X2|Ci),……,P(Xn|Ci);
(5)对某个未知样本X,可以计算出样本X属于每一个类别Ci的概率P(X|Ci)P(Ci),并把其分配给其中最大概率的类别。
所述数据处理包括数据切换模块,数据切换模块采用如下模型:
f(x(k))=clnx(k)+d;
式中:
x(k):系统原始行为数据序列;
f(x(k)):为非负变换;
C:c≥max{x(k)k=1,2,…,n},x(k)>e。
d:为一常数。
所述知识图谱采用动态权重调整算法的具体过程如下:
对于每一个训练样例,首先从本文中提取样例中的实体词集合V′=(υ1,υ2,...,υm),对于某个实体词vi,通过如下公式计算vi的权重;
其中,υi代表V’中的某个实体词,υi代表V’中除υi外其他的任意实体词。α为调整系数,用来控制权重调整的比率,每个实体词的初始权重initial weight为1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉首大学,未经吉首大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810841115.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种物联网数据预处理方法及系统
- 下一篇:一种面向聚类集成的权重计算方法