[发明专利]模型的数据域扩张方法、装置、电子设备及计算机可读存储介质在审

专利信息
申请号: 202110342793.5 申请日: 2021-03-30
公开(公告)号: CN112966821A 公开(公告)日: 2021-06-15
发明(设计)人: 王杰;赵建春;田凯彬;丁大勇 申请(专利权)人: 北京致远慧图科技有限公司
主分类号: G06N3/08 分类号: G06N3/08;G06N3/04;G06T7/00
代理公司: 北京墨丘知识产权代理事务所(普通合伙) 11878 代理人: 代峰;谷轶楠
地址: 100872 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 模型 数据 扩张 方法 装置 电子设备 计算机 可读 存储 介质
【说明书】:

发明实施例公开了一种模型的数据域扩张方法、装置、电子设备及计算机可读存储介质。其中,该方法包括:使用第一数据域的第一数据集对人工智能模型进行训练,得到针对第一数据域的第一已训练模型;使用第一数据域和第二数据域的第二数据集进行基于域适应的模型迁移,得到适应于第二数据域的第二已训练模型;将所述第一已训练模型和所述第二已训练模型同时作为教师模型进行知识蒸馏,得到域扩张后的第三模型。本发明实施例的技术方案可获得在多个域中均具有良好性能的深度模型,具有更好的泛化能力。

技术领域

本发明涉及人工智能技术领域,具体涉及一种模型的数据域扩张方法、装置、电子设备及计算机可读存储介质。

背景技术

利用以深度学习为代表的人工智能(AI)技术进行医学影像分类是目前计算机辅助诊断和筛查研究中的重点内容。深度学习已经在很多医学影像中有了应用,如利用眼底彩照进行糖尿病性视网膜病变的筛查,通过脑部CT进行脑肿瘤的分割,在胸片中检测肺结节,检查病理切片中是否含有肿瘤细胞等。在很多医学图像分析的任务上,AI模型可以表现出与人类专家相当的水平。

但AI模型的有效性很大程度上取决于数据的有效性。一般来说,数据上的分布称为域,来源不同的数据往往具有不同的分布,即不同数据域可能会有极大的差异。由于医学成像设备在品牌、型号、扫描模式、成像条件等方面的差异,即使是对于相同类型的病变,来自不同设备的医学影像样本往往呈现出明显视觉差异。这种视觉差异使得样本在特征空间的发布产生偏差,进一步表现为在同源数据上表现良好的图像分类模型在异源数据上识别准确率明显下降,因而要得到在各个环境下均有效的AI模型可能需要采集各个数据源(不同设备)的标注数据,导致收集来自各种设备的有标注数据成本极高,很难直接训练一个适用于各种设备的AI模型。

现有技术一般通过模型迁移的方式来尝试提升AI模型对于来自不同设备的样本的适应能力,降低数据标注成本。通常将能够获得的有标注的数据称为源域,不能获得标注的数据称为目标域;例如,采集自某设备并标注了的数据称为源域数据,而不能获得标注的来自其他型号设备的数据称作目标域数据。目前将AI模型从源域迁移到目标域主要是通过域适应(domain adaptation)技术,利用有标注的源域数据和未标注的目标域数据,最小化源域和目标域数据在特征空间上的分布来进行迁移。

然而,现有的域适应技术只关注于目标域上的性能,在提升目标域上的性能的同时往往会带来源域性能的下降,难以达到源域和目标域综合性能最优。而在实际应用中,深度模型需要处理来自不同域的数据,因而希望在各个域上模型性能均尽可能高。因此,如何将深度模型在不影响源域性能的情况下扩展到更多的域上,来达到综合性能最优,是需要解决的技术问题。

发明内容

针对现有技术中的上述技术问题,本发明实施例提出了一种模型的数据域扩张方法、装置、电子设备及计算机可读存储介质,以解决AI模型的数据域扩张时导致的源域性能下降的问题。

本发明实施例的第一方面提供了一种模型的数据域扩张方法,包括:

使用第一数据域的第一数据集对人工智能模型进行训练,得到针对第一数据域的第一已训练模型;

使用第一数据域和第二数据域的第二数据集进行基于域适应的模型迁移,得到适应于第二数据域的第二已训练模型;

将所述第一已训练模型和所述第二已训练模型同时作为教师模型进行知识蒸馏,得到域扩张后的第三模型。

在一些实施例中,所述进行知识蒸馏包括:

以所述第三模型作为学生模型进行机器学习,当输入数据是第一数据域中数据时,所述第三模型学习第一已训练模型的输出;当输入数据是第二数据域中数据时,所述第三模型学习第二已训练模型的输出。

在一些实施例中,所述第一数据集中的数据为来自第一数据域且带有标注的数据;所述第二数据集中的数据为来自第一数据域且带有标注的数据和来自第二数据域不带标注或带有少量标注的数据。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京致远慧图科技有限公司,未经北京致远慧图科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110342793.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top