[发明专利]基于因子图模型的自诊模型训练方法和装置有效
申请号: | 201410522719.1 | 申请日: | 2014-09-30 |
公开(公告)号: | CN104331600B | 公开(公告)日: | 2018-07-17 |
发明(设计)人: | 李岱峰;伊凯;李子龙;曾刚;钱立伟;陆彬;全伟;李理;白晓航;王浩 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G16H50/30 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 路凯;胡彬 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征数据 专业知识 模型训练 因子图 方法和装置 稀疏因子 图模型 交流 交流数据 经验数据 领域知识 内容构建 稀疏 收敛 存储 迁移 疾病 | ||
本发明实施例公开了一种基于因子图模型的自诊模型训练方法和装置。所述基于因子图模型的自诊模型训练方法包括:从收集到的专业知识数据中提取专业知识特征数据,并从收集到的医患交流数据中提取医患交流特征数据,其中,所述专业知识特征数据以及所述医患交流特征数据中均存储有疾病与症状之间的对应关系;根据所述专业知识特征数据以及所述医患交流特征数据的内容构建包括潜藏层的稀疏因子图模型;利用所述专业知识特征数据以及所述医患交流特征数据对所述稀疏因子图模型进行迁移训练,直至所述稀疏因子图模型的参数全部收敛。所述基于因子图模型的自诊模型训练方法和装置同时解决了领域知识偏差以及经验数据稀疏的问题。
技术领域
本发明实施例涉及计算机数据处理技术,尤其涉及一种基于因子图模型的自诊模型训练方法和装置。
背景技术
在互联网十分发达的今天,通过互联网向用户提供自诊服务的自诊系统十分流行。
现有的自诊系统大体上可以分为基于专业知识的自诊系统以及基于经验数据的自诊系统。基于专业知识的自诊系统参照领域知识为用户提供自诊建议。它给出的数据具有成熟的理论知识体系作支撑,因而非常权威。但是,实际的诊断过程中往往有一些领域知识不能预见的情况,比如患者所处的环境、患者自身体质。而实际诊断过程则需要综合考虑所有的情况对用户的患病情况给出准确的判断。因此,基于专业知识的自诊系统给出的自诊建议往往是存在偏差的。
基于经验数据的自诊系统依靠经验数据,没有成熟的理论体系作支撑。经验数据可以是实际诊断过程中患者与医生的交流数据。然而,实际的医患交流数据本身很可能是稀疏的。比如,医生在诊断过程中医生观察到病人的嗓音沙哑,并据此给出了诊断建议,但是并没有把他观察到的这一特征记录在医患交流数据中。所以,基于经验数据的自诊系统需要克服数据稀疏的问题。
发明内容
有鉴于此,本发明实施例提出一种基于因子图模型的自诊模型训练方法和装置,以同时解决领域知识偏差以及经验数据稀疏的问题。
第一方面,本发明实施例提供了一种基于因子图模型的自诊模型训练方法,所述方法包括:
从收集到的专业知识数据中提取专业知识特征数据,并从收集到的医患交流数据中提取医患交流特征数据,其中,所述专业知识特征数据以及所述医患交流特征数据中均存储有疾病与症状之间的对应关系;
根据所述专业知识特征数据以及所述医患交流特征数据的内容构建包括潜藏层的稀疏因子图模型;
利用所述专业知识特征数据以及所述医患交流特征数据对所述稀疏因子图模型进行迁移训练,直至所述稀疏因子图模型的参数全部收敛。
第二方面,本发明实施例提供了一种基于因子图模型的自诊模型训练装置,所述装置包括:
特征提取模块,用于从收集到的专业知识数据中提取专业知识特征数据,并从收集到的医患交流数据中提取医患交流特征数据,其中,所述专业知识特征数据以及所述医患交流特征数据中均存储有疾病与症状之间的对应关系;
模型构建模块,用于根据所述专业知识特征数据以及所述医患交流特征数据的内容构建包括潜藏层的稀疏因子图模型;
模型训练模块,用于利用所述专业知识特征数据以及所述医患交流特征数据对所述稀疏因子图模型进行迁移训练,直至所述稀疏因子图模型的参数全部收敛。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410522719.1/2.html,转载请声明来源钻瓜专利网。