[发明专利]抗后门攻击的智能医疗影像诊断意见自动生成方法有效
申请号: | 202310029752.X | 申请日: | 2023-01-09 |
公开(公告)号: | CN115938530B | 公开(公告)日: | 2023-07-07 |
发明(设计)人: | 温金明;赵帅;何梓濠;张雨林;李庆 | 申请(专利权)人: | 人工智能与数字经济广东省实验室(广州) |
主分类号: | G16H15/00 | 分类号: | G16H15/00;G16H50/20;G06F40/232;G06T7/00;G06N3/048 |
代理公司: | 广州科粤专利商标代理有限公司 44001 | 代理人: | 杨可维;黄培智 |
地址: | 510330 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 后门 攻击 智能 医疗 影像 诊断 意见 自动 生成 方法 | ||
1.一种抗后门攻击的智能医疗影像诊断意见自动生成方法,其特征在于,包括以下步骤:
获取影像表现数据,并对所述影像表现数据进行数据预处理,得到样本数据;
以有标签的所述样本数据作为输入数据,以及以诊断意见作为输出数据建立基于深度学习的医疗影像诊断意见自动生成模型;
使用字符级别的触发器对所述医疗影像诊断意见自动生成模型注入攻击样本,利用n-gram算法找寻并过滤所述攻击样本中的错误词语并给予纠错建议,并结合对抗训练进一步提升所述医疗影像诊断意见自动生成模型的抗攻击性;
所述医疗影像诊断意见自动生成模型的建立过程包括:
以BERT作为基础网络建立预训练语言模型,将无标签的所述样本数据输入所述预训练语言模型进行训练,获得以中文医学专业术语为目标的所述预训练语言模型;
以所述预训练语言模型为基础,结合有标签的所述样本数据,使用UNILM策略进行微调,建立所述医疗影像诊断意见自动生成模型,深度挖掘输出影像表现和患者病理之间的关联特征,并将所述关联特征转换为相应的特征数据,通过深度学习模型解码输出所述特征数据;
利用Copy机制对输入的所述样本数据中的专业术语直接进行复制,通过所述医疗影像诊断意见自动生成模型输出所述诊断意见;
使用稀疏优化算法优化所述医疗影像诊断意见自动生成模型的激活函数。
2.如权利要求1所述的抗后门攻击的智能医疗影像诊断意见自动生成方法,其特征在于,所述数据预处理包括数据脱敏化处理、数据拆分和数据长度限制。
3.如权利要求2所述的抗后门攻击的智能医疗影像诊断意见自动生成方法,其特征在于,所述数据脱敏化处理包括:利用正交匹配算法对所述影像表现数据中的患者信息进行筛选,得到不含所述患者信息的所述影像表现数据;所述数据拆分包括;对不含所述患者信息的所述影像表现数据中包含患者检查部位的描述、患者疾病描述,以及患者多次检查情况对比描述元素进行拆分;数据长度限制包括:对拆分后的所述影像表现数据进行截断或者填补操作,得到数据长度统一的所述样本数据。
4.如权利要求1所述的抗后门攻击的智能医疗影像诊断意见自动生成方法,其特征在于,经过优化后的所述激活函数为:
其中,s为所述激活函数的输出,e为对数运算,Ωp为概率子集,p表示概率值,softmax(s)为原始激活函数。
5.如权利要求1所述的抗后门攻击的智能医疗影像诊断意见自动生成方法,其特征在于,所述利用n-gram算法找寻并过滤攻击样本中的错误词语并给予纠错建议包括:
对所述攻击样本进行分词及词性标注,分别统计每个词语上下文的一元、二元及三元n-gram词条,并对应地添加到n-gram词表里,在纠错阶段,对所述攻击样本中的当前词,利用所述当前词上下文的3个n-gram词条和所述n-gram词表,共同计算所述当前词在n-gram词表中出现的次数总和,若所述次数总和小于预设阈值则判定为触发词,获取用于对所述触发词进行纠错的候选词,以及所述候选词的词频,基于所述候选词和所述触发词之间的拼音编辑距离,计算所述候选词与所述触发词的拼音相似度,以各个所述拼音相似度为基准计算对应的所述候选词的分值,所有所述候选词按照所述分值从大到小进行排序,取前N个所述候选词,若存在所述候选词与所述触发词的编辑距离小于或等于1,则优先返回当前的所述候选词,否则返回N个所述候选词中拼音相似度最高的候选词。
6.如权利要求5所述的抗后门攻击的智能医疗影像诊断意见自动生成方法,其特征在于,所述候选词的分值计算为:
其中,x为候选词,M为候选词表,c为触发词,Freqx为候选词x的词频,Similarx,c为候选词x与触发词c的拼音相似度数,Wd为对应的词表字典的权重,d为词表,3表示所使用的3个n-gram词条。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于人工智能与数字经济广东省实验室(广州),未经人工智能与数字经济广东省实验室(广州)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310029752.X/1.html,转载请声明来源钻瓜专利网。