[发明专利]一种基于全局视频特征的密集视频字幕生成方法在审
申请号: | 202210801636.0 | 申请日: | 2022-07-08 |
公开(公告)号: | CN115190332A | 公开(公告)日: | 2022-10-14 |
发明(设计)人: | 徐颂华;刘安然;周林韵;李宗芳;徐宗本 | 申请(专利权)人: | 西安交通大学医学院第二附属医院 |
主分类号: | H04N21/234 | 分类号: | H04N21/234;H04N21/44;H04N21/488;H04N5/278;G06V10/762;G06V10/764;G06V10/82 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 姚咏华 |
地址: | 710004 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于全局视频特征的密集视频字幕生成方法,本发明通过自适应聚类的方法在只输入整段视频的情况下编码其全局特征,进而以端到端的方式指导事件定位和字幕生成,略去了先前模型利用先验阈值进行事件提案划分的步骤,从而在保证字幕生成准确性的条件下大大降低了计算复杂度。本发明在处理长序列特征时能够自适应地将相近的特征查询聚类进而降低冗余,节省内存。同时,作为传统Transformer中完整自注意力机制的快速近似,该方法在编码准确性方面也表现优异。 | ||
搜索关键词: | 一种 基于 全局 视频 特征 密集 字幕 生成 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学医学院第二附属医院,未经西安交通大学医学院第二附属医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210801636.0/,转载请声明来源钻瓜专利网。