[发明专利]一种多模态自动提取交通场景信息的方法、系统及设备在审

申请号：	202210235588.3	申请日：	2022-03-11
公开（公告）号：	CN114926788A	公开（公告）日：	2022-08-19
发明（设计）人：	张蕊;卓一帆	申请（专利权）人：	武汉理工大学
主分类号：	G06V20/54	分类号：	G06V20/54;G06V30/148;G06V20/40;G06V10/82;G06N3/08;G06N3/04
代理公司：	武汉科皓知识产权代理事务所(特殊普通合伙) 42222	代理人：	肖明洲
地址：	430070 湖***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种多模态自动提取交通场景信息方法系统设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种多模态自动提取交通场景信息的方法及及电子设备，通过获取交通场景监控视频、新闻报道图片及文本、天气信息，对它们进行预处理后，用卷积神经网络提取特征，并采用词嵌入将文本转换为语义向量，通过多个注意力机制组件生成交通解说文本，同时基于交通领域专业语料库，采用生成对抗网络以及奖惩机制，使生成的句子具有交通领域专业性，最终实现对交通场景的解说。本发明通过多模态的输入数据，使得对交通场景的解说更加具有时效性、准确性、专业性，同时节约了人力成本。

技术领域

本发明属于计算机图像、自然语言处理技术领域，涉及一种自动提取交通场景信息的方法、系统及设备，具体涉及一种多模态自动提取交通场景信息的方法、系统及设备，可以进一步应用到根据交通监控视频和新闻报道图片及新闻文本来自动生成专业性的解说。

背景技术

目前，在交通运输系统中，有大量的录影录像设备实时监控交通状况，同时新闻媒体十分发达，基于互联网，新闻信息的传播速度极其快，气象预报越来越准确，全球定位系统精准度大幅度提高，这些数据有很高的价值，可以将它们应用于交通场景自动播报领域。当前，在繁忙的交通要道，交通状况十分复杂，各种危险事件随时可能发生，驾驶员需要及时获取最新路况事件信息，从而做出更合理的应对措施。

已有的研究大都集中在交通流量预测、交通轨迹分类，但对于具体事件无法获知，交通广播也具有一定的延时性，并且通常也没有针对性，对于不同区域的驾驶员无法做到个性化定制，无法适应复杂多变的交通场景。

发明内容

为了解决上述技术问题，本发明基于计算机图像和自然语言处理技术，提供了一种多模态自动提取交通场景信息的方法及电子设备，可以针对特定的交通场景，解析其中的事件及意义，进一步对交通场景进行实时播报。

本发明的方法所采用的技术方案是：一种多模态自动提取交通场景信息的方法，包括以下步骤：

步骤1：获取交通场景的监控视频，抓取与该交通场景相关的新闻图片和文字，及当前的天气信息；

步骤2：从监控视频中每隔预定时间截取一帧I_i，按时间顺序存储为视频帧序列集合，将视频帧和抓取的新闻图片提取图像特征，得到特征向量v_i，由一个视觉编码器处理该特征向量序列，该视觉编码器属于“编码器-解码器框架”中的编码器，内部包含了自注意力机制(Self-Attention)组件，其中，首先处理特征向量序列v得到每一个视频帧以及新闻图片的特征表示h_i，进而获取视觉编码器的最终输出h，h是h_i序列经过合并，随后乘以一个权重矩阵而得出的向量，它包含视觉特征；

步骤3：将抓取的新闻文字和天气信息合并后得到文本向量序列ee₁,e₂,…,e_L，其中e_i表示一个词，随后采用词嵌入将文本序列转换为词向量表示，由一个文本编码器处理该向量序列，文本编码器属于“编码器-解码器框架”中的编码器，内部包含了自注意力机制(Self-Attention)组件，其中，首先处理文本向量序列e获取价值信息，再联合步骤2中视觉编码器的输出h，得到文本中每个词的特征表示g_i，进而获取文本编码器的最终输出g，g是g_i序列经过合并，随后乘以一个权重矩阵而得出的向量，它包含文本特征；

步骤4：生成交通场景信息文本。

本发明的系统所采用的技术方案是：一种多模态自动提取交通场景信息的系统，包括以下模块：

模块1，用于获取交通场景的监控视频，抓取与该交通场景相关的新闻图片和文字，及当前的天气信息；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于武汉理工大学，未经武汉理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202210235588.3/2.html，转载请声明来源钻瓜专利网。

上一篇：工业互联网可信能力评估方法及相关设备
下一篇：一种用于增氧曝气机的磁化富氧装置

同类专利

专利分类

G 物理

G06 计算；推算；计数

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种多模态自动提取交通场景信息的方法、系统及设备在审

专利文献下载