[发明专利]基于多注意力卷积神经网络的智能导诊方法及系统有效
申请号: | 202010464150.3 | 申请日: | 2020-05-27 |
公开(公告)号: | CN111709233B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 王志;余新蕊;惠维 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/30;G06F40/216;G06F16/35;G06F16/951;G06N3/0464;G06F18/2415;G06F18/213;G16H40/20 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 朱海临 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 注意力 卷积 神经网络 智能 导诊 方法 系统 | ||
本发明公开的基于多注意力卷积神经网络的智能导诊方法及系统,使用患者自述症状作为训练数据,最大程度地保留患者症状描述的语义信息,其次,有很多疾病有相似的症状,仅依靠症状描述词难以精确对应某种疾病,同时避免了先提取疾病再对应科室步骤中可能造成的信息丢失的问题。在嵌入层加入BERT模型,词向量包含上下文信息,更好地获取了词向量;另外在池化层加入多头注意力,获取词的权重,使模型更关注辨识性比较高的词汇,同时添加了患者个人信息特征,增加了导诊的正确率。
技术领域
本发明涉及自然语言处理以及数据处理的领域,涉及一种基于多注意力卷积神经网络的智能导诊方法及系统,以提高导诊的准确性。
背景技术
随着智能化信息化的浪潮,医院的导诊方法也由很传统的人工分诊台导诊变成了结合互联网+的智能导诊方法,能够帮助患者进行自助导诊,使患者对疾病有初步的判断,减少患者挂错科室的概率。
目前比较流行的智能导诊的方法是从患者描述的症状中提取症状关键词,然后根据症状关键词和某个疾病的病理描述词的相似度进行匹配,诊断疾病,然后根据疾病和科室的映射关系为患者推荐相应的科室。首先,患者的症状描述过于口语化,在提取症状关键词的时候,忽略了除去症状关键词之外的语义信息。此外,多种疾病可能拥有相似的症状,即一种症状对应多个疾病,这样可能会造成推荐科室时推荐不准确。
发明内容
针对现有的导诊方法在分诊时容易出现错误的问题,本发明提供一种基于多注意力卷积神经网络的智能导诊方法,提高导诊的准确率。
本发明是通过以下技术方案来实现:
一种基于多注意力卷积神经网络的智能导诊方法,包括以下步骤:
步骤1、获取患者问答数据,以及问答数据对应的诊治科室;
步骤2、对问答数据进行预处理,得到训练数据集;
步骤3、构建基于多头注意卷积神经网络的智能导诊模型,包括嵌入层、卷积层、池化层和分类器;
嵌入层,用于对训练数据集进行预训练,输出嵌入矩阵;
卷积层,用于对嵌入矩阵进行卷积操作,输出特征图;
池化层,用于对特征图进行池化操作,得到带有词权重信息的特征向量;
分类器,用于对词的不同权重进行K分类,输出推荐诊疗科室;
步骤4、采用训练数据集对基于多头注意卷积神经网络的智能导诊模型进行训练;
步骤5、将患者的个人信息以及病症信息输入至训练后的基于多头注意卷积神经网络的智能导诊模型,得到患者病症对应的诊疗科室。
优选的,步骤1中,所述患者问答数据包括患者的病症、年龄、性别以及对应的挂号科室,同时建立挂号科室与标准科室名称的对应关系。
优选的,采用相似度计算方法建立科室与标准科室的对应关系。
优选的,步骤2中数据的预处理,使用分词工具结合词典对问答数据进行分词,将分词结果去停用词和标点符号后的结果进行去停用词处理,加入医学专有词典,统计词频建立医学专有词典,获得训练数据集。
优选的,所述分词工具为ICTCLAS、IKAnalyzer、HTTPCWS、SCWS、PhpanAlysis、盘古分词、腾讯文智或语言云。
优选的,步骤3中嵌入层采用BERT模型对训练数据集进行预训练。
优选的,步骤4中基于多头注意卷积神经网络的智能导诊模型的训练方法如下:
步骤4.1、将训练数据集输入至嵌入层,通过BERT模型对训练数据集进行预训练,得到词向量矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010464150.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种银行介质业务自助集中处理装置
- 下一篇:一种办公桌