[发明专利]基于深度学习的消化内镜视频帧有效信息区域提取方法在审
申请号: | 202110354852.0 | 申请日: | 2021-03-31 |
公开(公告)号: | CN113012140A | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 张阔;刘奇为;于天成;胡珊 | 申请(专利权)人: | 武汉楚精灵医疗科技有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T7/11;G06T7/187;G06T3/40;G06N3/04;G06N3/08 |
代理公司: | 上海精晟知识产权代理有限公司 31253 | 代理人: | 王占房 |
地址: | 430000 湖北省武汉市东湖新技术开发区高新大道81*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 消化 视频 有效 信息 区域 提取 方法 | ||
1.基于深度学习的消化内镜视频帧有效信息区域提取方法,其特征在于:包括如下步骤:
S1、收集消化内镜检查视频片段并标注有效信息区域,根据标注文件对每张图片生成对应的黑白掩膜图;
S2、构建智能裁边模型;
S3、利用消化内镜的图片和对应的黑白掩膜图作为训练样本,对智能裁边模型进行训练,得到智能裁边模型的权重参数,用于后续计算有效信息区域;
S4、获取消化内镜检查的实时视频,将视频解帧为图片,缓存当前帧的图像;
S5、加载已经训练好的智能裁边模型的网络模型及对应的权重参数,将当前帧内镜图像通过该网络模型输出为整张图的是否有效信息区域的概率分布图,根据概率分布图计算得到该帧图像的有效信息区域;
S6、计算得到的有效信息区域范围对当前帧图像进行处理,提取该帧图像的有效信息区域,最终生成一张只包含有效信息区域的视频帧图像。
2.根据权利要求1所述的基于深度学习的消化内镜视频帧有效信息区域提取方法,其特征在于:所述步骤S1中收集不同型号,不同光源,不同消化道类型的消化内镜检查视频片段作为训练集。
3.根据权利要求1或2所述的基于深度学习的消化内镜视频帧有效信息区域提取方法,其特征在于:所述步骤S1中将视频片段解帧为图片,对每帧图像的有效信息区域进行人工标注。
4.根据权利要求3所述的基于深度学习的消化内镜视频帧有效信息区域提取方法,其特征在于:所述步骤S1中将图片尺寸进行压缩,并通过补黑边的方式保持长宽比例不变。
5.根据权利要求1所述的基于深度学习的消化内镜视频帧有效信息区域提取方法,其特征在于:所述步骤S2中构建智能裁边模型是对称的编码-解码结构,解码结构和编码结构分别由卷积模块组成。
6.根据权利要求5所述的基于深度学习的消化内镜视频帧有效信息区域提取方法,其特征在于:所述编码结构为下采样,用于接收输入并输出特征向量的网络;所述解码结构为上采样,用于从编码结构中获取特征向量,输出与预期输出最近似的结果。
7.根据权利要求1所述的基于深度学习的消化内镜视频帧有效信息区域提取方法,其特征在于:所述智能裁边模型根据损失函数进行训练,损失函数为:
其中N表示样本数,yi表示像素的真实标签,yi=0表示该像素为无效区域,yi=1表示该像素为有效信息区域;表示网络模型预测该像素的概率值,取值范围为
8.根据权利要求1或7所述的基于深度学习的消化内镜视频帧有效信息区域提取方法,其特征在于:所述步骤S5中利用概率分布图计算得到图片的有效信息区域的掩膜图,其公式为:
其中mask(i,j)为生成的掩膜图在(i,j)位置处的像素值p(i,j),为概率分布图在(i,j)位置处的概率值,i,j分别为图像矩阵的第i行,第j列。
9.根据权利要求1所述的基于深度学习的消化内镜视频帧有效信息区域提取方法,其特征在于:所述步骤S7中根据不规则形状的有效图像区域,取其外接矩形,最终生成只包含有效信息区域的图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉楚精灵医疗科技有限公司,未经武汉楚精灵医疗科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110354852.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种轨道交通电缆监测系统
- 下一篇:交叉路口快速通行控制方法及其系统