[发明专利]基于深度学习的视频会议场景人形检测方法在审

申请号：	202111315469.0	申请日：	2021-11-08
公开（公告）号：	CN113989850A	公开（公告）日：	2022-01-28
发明（设计）人：	丁帆;任永忠;梅宇青;王沛;曾德军;陶宇	申请（专利权）人：	深圳市音络科技有限公司
主分类号：	G06V40/10	分类号：	G06V40/10;G06K9/62;G06N3/04;G06N3/08
代理公司：	南京创略知识产权代理事务所(普通合伙) 32358	代理人：	王丹
地址：	518000 广东省深圳市宝安区新安街道灵芝园社区22区勤诚达乐园***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于深度学习的视频会议场景人形检测方法，用于在视频会议场景中提取全景图像并检测各个人员在图像中的位置，有助于实现局部画面聚焦、辅助语音增强等；该方法使用摄像机从会议场景中采集原始全景图像并矫正；将矫正后的矩形全景图像拼接映射成长宽相等的方形图像，并作归一化预处理和数据增强；构建基于残差网络‑特征金字塔网络的深度学习模型；建立边界框回归网络，同时计算出人体目标四周边框位置以及置信度和中心加权；使用自适应焦点损失来训练模型，输入会议场景图像进行训练。本发明通过边界回归、中心加权和自适应焦点损失来引导模型适应特殊场景中的人体目标，从而提高密集人员会议场景下检测的准确率、召回率，具有良好的应用前景。
搜索关键词：	基于深度学习视频会议场景人形检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

暂无信息

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于深圳市音络科技有限公司，未经深圳市音络科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/202111315469.0/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于深度学习的视频会议场景人形检测方法在审

专利文献下载