[发明专利]医疗自动问答方法及装置、存储介质、电子设备有效
申请号: | 201810939302.3 | 申请日: | 2018-08-17 |
公开(公告)号: | CN108932349B | 公开(公告)日: | 2019-03-26 |
发明(设计)人: | 鹿文鹏;张玉腾;张若雨;张旭;岳书通;成金勇 | 申请(专利权)人: | 齐鲁工业大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G16H80/00;G06N3/04 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 孙园园 |
地址: | 250353 山东省济南*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了医疗自动问答方法及装置、存储介质、电子设备,属于自然语言处理技术领域及计算机人工智能领域,本发明要解决的技术问题为如何使用自然语言处理技术为患者在已有的问答结果中选择匹配的答案并将其推荐给用户,减少医生的工作量,提高问题解答的速度,采用的技术方案为:①一种医疗自动问答方法,该方法包括如下步骤:S1、构建医疗问答知识库;S2、构建问答模型训练数据集;S3、构建问答模型;S4、训练问答模型和答案选择。②一种医疗自动问答装置,该装置包括:医疗问答知识库构建单元、问答模型训练数据集生成单元、问答模型构建单元以及问答模型训练和答案选择单元。 | ||
搜索关键词: | 模型训练 自动问答 医疗 构建 自然语言处理技术 存储介质 答案选择 电子设备 数据集 知识库 模型构建单元 人工智能领域 自动问答装置 知识库构建 生成单元 问题解答 匹配 工作量 答案 计算机 医生 | ||
【主权项】:
1.一种医疗自动问答方法,其特征在于,该方法包括如下步骤:S1、构建医疗问答知识库:从互联网的医疗问答社区爬取问答对,并对问答对进行预处理构建成医疗问答知识库;S2、构建问答模型训练数据集;对于每个医疗问题,在步骤S1中的医疗问答知识库中至少有一个正确答案,将正确答案与问题构建训练正例,将除正确答案以外的答案与问题构建训练负例;S3、构建问答模型:利用卷积神经网络构建问答模型;其中,构建问答模型的具体步骤如下:S301、构建字符映射转换表:根据步骤S1中预处理以后构建的医疗问答知识库,构建字符表,并将字符表中的字符映射为唯一的数字表示;S302、构建输入层:输入层包括三个输入内容,从问题对应的训练正例中获取question和answer,从训练负例中获取bad‑answer,输入层的形式为(question,answer,bad‑answer);再根据步骤S301中得到的字符映射转换表将输入数据中的字符转化为数字表示;S303、构建字符向量映射层:指定字符向量的维度大小为embedding_dim,步骤S301中获取的字符表大小为vocab_num,使用[‑1,1]的均匀分布定义(vocab_num+1)×embedding_dim的二维矩阵并将其作为模型的字符向量映射层的权重矩阵,其中,每一行对应医疗问答知识库中单个字符的向量表示;S304、构建多尺度卷积层和堆叠卷积层:多尺度卷积层是利用不同尺寸的卷积核与经过步骤S303处理后的数据做卷积操作,捕获问题或答案里的字符级别的n‑gram特征作为输出;堆叠卷积层是将不同尺寸的卷积核堆叠起来,将经过步骤S303处理后的数据自下而上地与各个卷积核做卷积操作,捕获问题或答案里句子级别的语义特征作为输出;再将多尺度卷积层的输出与堆叠卷积层的输出联接起来,作为问题或答案的特征向量;S305、构建相似度计算层:使用余弦相似度公式计算得到问题和正确答案的相似度sim_pos以及问题与错误答案的相似度sim_neg;余弦相似度的计算公式如下所示:
其中,‖·‖表示L2范数,Q和A分别指问题和正确答案或错误答案经过问答模型处理后获得的向量表示;Q表示vector_question的向量,A表示vector_answer或vector_bad‑answer的向量;S4、训练问答模型和答案选择:在步骤S2所得到问答模型训练数据集中对步骤S3构建的问题模型进行训练。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于齐鲁工业大学,未经齐鲁工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810939302.3/,转载请声明来源钻瓜专利网。