[发明专利]一种利用分层卷积自注意力网络解决开放式长视频问答任务的方法有效
| 申请号: | 201910585462.7 | 申请日: | 2019-07-01 |
| 公开(公告)号: | CN110377711B | 公开(公告)日: | 2022-04-01 |
| 发明(设计)人: | 赵洲;孟令涛;张竹;袁晶;怀宝兴 | 申请(专利权)人: | 浙江大学 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/738;G06F16/783 |
| 代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 郑海峰 |
| 地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种利用分层卷积自注意力网络解决开放式长视频问答任务的方法。主要包括如下步骤:1)针对视频与问题,分层卷积自注意力编码器网络获取多层视频语义表达。2)对获得的视频帧的多层视频语义表达,计算损失函数并训练模型,利用训练后的分层卷积自注意力网络,对开放式长视频问答任务进行回答语句生成。相比于一般的开放式长视频问答任务解决方案,本发明对多种有效信息进行综合利用。本发明在开放式长视频问答任务中所取得的效果相比于传统的方法更好。 | ||
| 搜索关键词: | 一种 利用 分层 卷积 注意力 网络 解决 开放式 视频 问答 任务 方法 | ||
【主权项】:
1.一种利用分层卷积自注意力网络解决开放式长视频问答任务的方法,其特征在于包括如下步骤:1)针对视频与问题语句,利用分层卷积自注意力编码器网络获取多层视频语义表达;2)利用步骤1)获取的多层视频语义表达,计算GRU注意力解码器输出向量,进一步得到分层卷积自注意力网络损失函数;3)利用步骤2)得到的分层卷积自注意力网络损失函数,对分层卷积自注意力网络进行训练;输入视频与对应问题语句,利用训练后的分层卷积自注意力网络对开放式长视频问答任务进行回答语句生成。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910585462.7/,转载请声明来源钻瓜专利网。





