[发明专利]基于因子图模型的自诊模型训练方法和装置有效
| 申请号: | 201410522719.1 | 申请日: | 2014-09-30 |
| 公开(公告)号: | CN104331600B | 公开(公告)日: | 2018-07-17 |
| 发明(设计)人: | 李岱峰;伊凯;李子龙;曾刚;钱立伟;陆彬;全伟;李理;白晓航;王浩 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
| 主分类号: | G16H50/20 | 分类号: | G16H50/20;G16H50/30 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 路凯;胡彬 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 特征数据 专业知识 模型训练 因子图 方法和装置 稀疏因子 图模型 交流 交流数据 经验数据 领域知识 内容构建 稀疏 收敛 存储 迁移 疾病 | ||
1.一种基于因子图模型的自诊模型训练方法,其特征在于,包括:
从收集到的专业知识数据中提取专业知识特征数据,并从收集到的医患交流数据中提取医患交流特征数据,其中,所述专业知识特征数据以及所述医患交流特征数据中均存储有疾病与症状之间的对应关系,且所述专业知识特征数据为根据专业知识构建的数据,包括专家知识库与题库;
根据所述专业知识特征数据以及所述医患交流特征数据的内容构建包括潜藏层的稀疏因子图模型;
利用所述专业知识特征数据以及所述医患交流特征数据对所述稀疏因子图模型进行迁移训练,直至所述稀疏因子图模型的参数全部收敛;
其中,在利用所述专业知识特征数据以及所述医患交流特征数据对所述稀疏因子图模型进行迁移训练之后,还包括:
接收用户输入的症状,并根据所述稀疏因子图模型对输入症状的输出结果向用户反馈关于输入症状的自诊结果。
2.根据权利要求1所述的方法,其特征在于,根据所述专业知识特征数据以及所述医患交流特征数据的内容构建包括潜藏层的稀疏因子图模型包括:
将所述专业知识特征数据与所述医患交流特征数据中的每种症状对应为所述稀疏因子图模型中的一个输入单元,不同的输入单元构成所述稀疏因子图模型的输入层;
将所述专业知识特征数据与所述医患交流特征数据每种疾病对应于所述稀疏因子图模型中的一个输出单元,并由不同的输出单元构成所述稀疏因子图模型的输出层;
将所述专业知识特征数据与所述医患交流特征数据中的每个实例对应为一个因子,并由不同的因子构成因子层;
确定潜藏层中潜藏单元的数量,所述潜藏单元用于将所述因子层中的因子与所述输出层中的输出单元连接。
3.根据权利要求2所述的方法,其特征在于,利用所述专业知识特征数据以及所述医患交流特征数据对所述稀疏因子图模型进行迁移训练时使用的对数似然函数如下:
其中,yi表示所述稀疏因子图模型对于第i个疾病的输出估计值,θik表示输出yi在第k个潜层变量上的概率映射,Ωkn表示第k个潜层变量在第n个输出变量上的概率映射,α表示在针对专业知识特征数据的输出值与潜藏层单元之间关系的权值,μ表示在针对医患交流特征数据的输出值与潜藏层单元之间关系的权值,β表示输出单元之间相关关系的权值;yiD表示输出层对因子层上第i个实例给出的患者所患疾病是否疾病D的概率输出;θi表示潜藏层上潜藏单元对于所述第i个实例的概率向量;f(yiD,θi)=yiD·θi;P(yj,yj')表示输出单元之间的联合概率。
4.根据权利要求3所述的方法,其特征在于,利用所述专业知识特征数据以及所述医患交流特征数据对所述稀疏因子图模型进行迁移训练,直至所述稀疏因子图模型的参数全部收敛包括:
固定α、β和μ,采用Jensen不等式确定所述稀疏因子图模型中的θik和Ωkn;
待θik和Ωkn的取值收敛,保持θik和Ωkn参数的取值不变,采用环路信念传播LBP确定所述稀疏因子图模型中的α、β和μ。
5.根据权利要求4所述的方法,其特征在于,所述专业知识特征数据以及所述医患交流特征数据均采用资源描述框架RDF格式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410522719.1/1.html,转载请声明来源钻瓜专利网。





