[发明专利]一种融合知识扩展和卷积神经网络的糖尿病预测方法在审
申请号: | 202310455550.1 | 申请日: | 2023-04-25 |
公开(公告)号: | CN116403706A | 公开(公告)日: | 2023-07-07 |
发明(设计)人: | 徐鹤;朱静抒;程海涛;王汝传;李鹏;刘尚东;季一木;许硕洋;杨丹丹;鲍善军 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G16H50/70;G06F40/30;G06F40/295;G06N3/0464;G06N3/0442;G06N3/047;G06N3/042;G06N3/08 |
代理公司: | 南京正联知识产权代理有限公司 32243 | 代理人: | 王素琴 |
地址: | 210023 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 知识 扩展 卷积 神经网络 糖尿病 预测 方法 | ||
一种融合知识扩展和卷积神经网络的糖尿病预测方法,构建了一种以词嵌入向量和文本嵌入向量作为双通道输入的语义增强卷积神经网络模型,使得模型能够关注到更为重要的糖尿病特征并捕捉到更细粒度的糖尿病语义信息,从而提高了对糖尿病的诊断准确率;解决对大规模糖尿病领域标注数据的强依懒性和糖尿病领域知识的缺乏性等问题,设计了在糖尿病诊断过程引用外部知识的方法可以对数据集起到一个数据增强效果,并减少深度学习模型训练所需数据;解决了医疗数据集的小规模导致深度学习模型学习结果泛化能力不强,无法获得满意糖尿病预测结果问题。
技术领域
本发明属于人工智能和数据处理领域,具体涉及一种融合知识扩展和卷积神经网络的糖尿病预测方法。
背景技术
随着人工智能的发展,渐趋成熟的AI技术正逐步向医疗领域转向。智能医疗是将人工智能技术应用于疾病诊疗中,通过大数据和深度挖掘等技术,对病人的医疗数据进行分析和挖掘,自动识别病人的临床变量和指标。计算机通过学习相关的专业知识,模拟医生的思维和诊断推理,从而给出可靠诊断和治疗方案,即计算机成为具有医学知识的大脑,为医生的诊断和治疗提供辅助决策。深度学习有着强大的特征学习技能,在语音识别、自然语言处理(NLP)以及计算机视觉(CV)取得了显著的成绩。
当前,深度学习技术在在疾病诊断领域得到广泛应用。深度学习采用自动提取特征的方法替代人工提取特征,不仅提高了效率,而且自动提取特征的方法也使得分类任务更准确,其原因是更容易获取结构化的高抽象映射。然而,深度学习技术无法摆脱对大规模标注数据的依赖。我国在医疗卫生领域数据采集方面尚未形成系统化的法规,而且医疗数据又涉及个人隐私,导致医疗数据的获取困难。数据量的缺乏使得深度学习模型学习的结果泛化能力不强。除了数据量不足之外,人工智能医疗目前存在的最大问题在于数据的来源和质量,从医院采集医疗数据大多数标注依赖人工识别。而这种手工产生的数据,质量上存在很大问题。因此,医疗数据集的小规模仍然是深度学习模型无法获得满意结果的一个问题。
当前,人工智能学习模式主要以海量数据为驱动,这种现有的数据驱动型人工智能手段存在标注数据获取、可解释性弱等问题。在现有的数据驱动型模型引入领域知识为引导和约束,可以有效缓解这些问题,增加模型的可解释性,并减少模型对大量数据的依赖。例如在医学图像领域,医学图像数据集的稀缺一直是阻碍该领域深度学习模型发展的重要因素。此时在给定的医疗数据集引入医生知识可以极大地提高了深度学习模型的效果。
目前,关于糖尿病的诊断都是依赖数据驱动技术实现的,即仅仅依靠患者体检诊断出的一些数值型数据,输入到模型中,让模型去诊断和推理。其结果缺乏可解释性且无法发现隐含的疾病症状。
发明内容
基于上述问题,提出一种融合知识扩展和卷积神经网络的糖尿病预测方法(KE-CNN),解决了医疗数据集的小规模导致深度学习模型学习结果泛化能力不强,无法获得满意糖尿病预测结果问题。本方法首先从体检指标数据筛选提取糖尿病患者异常指标特征集合,并借助Word2vec对异常指标特征词进行词嵌入;然后,利用知识图谱对病情描述文本进行医疗实体识别和知识扩展,并借助预训练的中文词向量对知识扩展后的病情描述文本进行文本嵌入;最后,构建一种以词嵌入向量和文本嵌入向量作为双通道输入的语义增强卷积神经网络模型,从而增强模型的特征表达。本方法主要对糖尿病预测方法进行了改进,为了解决对大规模糖尿病领域标注数据的强依懒性和糖尿病领域知识的缺乏性等问题,设计了在糖尿病诊断过程引用外部知识的方法可以对数据集起到一个数据增强效果,并减少深度学习模型训练所需数据。
一种融合知识扩展和卷积神经网络的糖尿病预测方法,主要步骤如下:
(1)首先从体检指标数据筛选提取糖尿病患者异常指标特征集合,并借助Word2vec的CBOW模型对异常指标特征词进行词嵌入。这作为输入到CNN的一条通道。CBOW模型的输入是上下文词来预测中心词,把当前句子中的中心词作为标签,构建神经网络学习,从而实现上下文词预测中心词。基于此方法,可以得出糖尿病与哪些指标存在很大的相关性,从而让KE-CNN模型关注更细粒度的糖尿病信息特征,便于提升卷积神经网络模型的效果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310455550.1/2.html,转载请声明来源钻瓜专利网。