专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果62个,建议您升级VIP下载更多相关专利
  • [发明专利]基于时序复原任务的自监督式视频表征学习方法和设备-CN202310646938.X在审
  • 王瀚漓;陈子彧 - 同济大学
  • 2023-06-02 - 2023-09-22 - G06V10/778
  • 本发明涉及一种基于时序复原任务的自监督式视频表征学习方法和设备,包括如下步骤:获取训练视频并划分为多个片段,选取用于训练的多个片段,打乱顺序并进行自动标注,构建时序复原任务;将用于训练的片段输入骨干网络中,获取各个片段对应的初级特征,将初级特征输入基于多头注意力的编码器,得到各个片段的顺序感知特征;将顺序感知特征聚合并输入基于硬注意力指针网络的解码器中,通过比较片段之间的时序逻辑关系得到复原后的片段序列,实现时序复原,根据复原后的片段序列计算损失函数值并对所述骨干网络的参数进行更新;重复上述步骤,选取不同的片段对所述骨干网络进行训练,获取预训练好的骨干网络。
  • 基于时序复原任务监督视频表征学习方法设备
  • [发明专利]一种视频文本检索方法、电子设备及介质-CN202310690827.9在审
  • 王瀚漓;于隽韬 - 同济大学
  • 2023-06-12 - 2023-09-12 - G06F16/783
  • 本发明涉及一种视频文本检索方法,将待检索的文本和视频集输入预先构建并训练后的视频文本检索模型中,获得文本与视频集中各视频的相似度,并以相似度最高的视频作为文本检索的结果;视频文本检索模型包括:初始特征提取模块:分别对输入文本和输入视频进行提取,生成初始文本特征和初始视频特征;事件特征提取模块:用以将初始文本特征和初始视频特征分别处理得到事件文本特征和事件视频特征;视频文本特征对齐模块:通过跨模态自注意力机制分别对事件文本特征和事件视频特征进行重建,以获得自适应语义对齐的重建视频特征和重建文本特征,输出各重建视频特征和重建文本特征的相似度。与现有技术相比,本发明具有检索性能高,运行开销小等优点。
  • 一种视频文本检索方法电子设备介质
  • [发明专利]一种文本生成图像方法、电子设备及介质-CN202310616784.X在审
  • 王瀚漓;陈文杰 - 同济大学
  • 2023-05-29 - 2023-08-25 - G06T11/00
  • 本发明涉及一种文本生成图像方法,将待处理文本输入预先构建并训练好的生成对抗网络中,由生成器输出与待处理文本语义一致的图像;以随机变量及文本描述作为生成器的输入,生成器输出与文本描述语义一致的风格多样的生成图像;在保持真实图像语义内容的同时,模拟生成图像中的结构失真,将得到的结构失真图像作为增强图像;对于判别器,将真实图像、增强图像和生成器输出的生成图像作为判别器的输入,判别器对各图像的真实性进行判别,同时输出各图像特征与文本描述的特征的相似性。与现有技术相比,本发明能够生成更为逼真,符合文本描述的生成图像。
  • 一种文本生成图像方法电子设备介质
  • [发明专利]基于离散高斯混合超先验和Mask的图像压缩方法及介质-CN202111519451.2有效
  • 王瀚漓;王圣凯 - 同济大学
  • 2021-12-11 - 2023-08-04 - H04N19/70
  • 本发明涉及一种基于离散高斯混合超先验和Mask的图像压缩方法及介质,所述方法包括以下步骤:对待压缩图像进行预处理,获得预处理图像;提取所述预处理图像的特征图,同时基于所述预处理图像的空间特征信息,生成Mask值,将所述特征图和Mask值进行点乘处理,获得隐变量表征;采用多个高斯分布提取隐变量表征的分布情况,生成离散高斯混合超先验值;对所述隐变量表征进行量化,基于所述超先验值对量化后的隐变量表征进行熵编码压缩,获得压缩图像的编码信息;基于所述压缩图像的编码信息解码获得重构图像。与现有技术相比,本发明具有压缩质量较好、图像压缩效率高等优点。
  • 基于离散混合先验mask图像压缩方法介质
  • [发明专利]一种基于模态变换与文本归纳的图像描述生成方法-CN201910357364.8有效
  • 王瀚漓;王含章 - 同济大学
  • 2019-04-29 - 2023-08-04 - G06V10/44
  • 本发明涉及一种基于模态变换与文本归纳的图像描述生成方法,该方法包括以下步骤:1)使用基于卷积神经网络的目标识别模型,将待描述图像划分为多个基于感兴趣区域的子块,提取子块的视觉特征;2)使用第一长短时记忆模型对每个子块的视觉特征进行解码,通过将视觉信息转换为语义信息实现模态变换,生成各子块的文本描述;3)使用第二长短时记忆模型对每个子块的文本描述进行再编码,提取各子块的语义特征;4)使用双向层级长短时记忆模型融合各子块的语义特征,获得融合语义特征;5)以所述融合语义特征作为第三长短时记忆模型的输入,生成待描述图像的文本描述。与现有技术相比,本发明具有准确度高等优点。
  • 一种基于变换文本归纳图像描述生成方法
  • [发明专利]一种模拟三维感知的视觉常识推理方法、装置及存储介质-CN202310239829.6在审
  • 王瀚漓;朱健 - 同济大学
  • 2023-03-14 - 2023-07-25 - G06F16/332
  • 本发明涉及一种模拟三维感知的视觉常识推理方法、装置及存储介质,所述方法包括以下步骤:获取待推理的视觉区域以及对应的问题文本和候选答案文本,以所述视觉区域及其对应的问题文本和候选答案文本作为输入,通过一经训练的视觉常识推理模型获得推理预测结果;其中,所述视觉常识推理模型包括:视觉特征增强层,用于将三维位置特征和深度特征融合入视觉特征中,获取视觉增强特征;深度引导关联层,采用深度差值引导的转换器,获取视觉引导;推理网络层,使用推理网络获取推理预测结果,推理网络的参数采用基于样本置信和批置信的多级优化方式获取。与现有技术相比,本发明具有推理准确性高、有效减少误判等优点。
  • 一种模拟三维感知视觉常识推理方法装置存储介质
  • [发明专利]一种基于位置编码融合的密集型视频描述方法-CN202010563286.X有效
  • 王瀚漓;杨思璇 - 同济大学
  • 2020-06-19 - 2023-07-11 - H04N21/84
  • 本发明涉及一种基于位置编码融合的密集型视频描述方法,该方法对待描述视频进行序列特征图提取,计算视频帧序列的绝对位置编码及上下文之间的相对位置编码,在自注意力机制编码模型中加权融合所述序列特征图、绝对位置编码和相对位置编码,计算图像相似度,对序列特征图进行重编码,基于重编码后的序列特征图对视频中的子事件进行定位并提取子事件特征图序列,基于注意力机制对多个所述子事件特征图序列按序解码成自然语言描述。与现有技术相比,本发明具有事件定位能力强、描述准确性高等优点。
  • 一种基于位置编码融合密集型视频描述方法
  • [发明专利]一种基于区块拼接的实时图像实例分割方法-CN202010362097.6有效
  • 王瀚漓;徐昱韬 - 同济大学
  • 2020-04-30 - 2023-07-07 - G06T7/11
  • 本发明涉及一种基于区块拼接的实时图像实例分割方法,包括以下步骤:1)采用第一多层卷积神经网络获取输入图像中物体实例的区块分布地图,并获取区块分布地图中每个像素的每个通道对应的值,即区块像素预测值b;2)采用第二多层卷积神经网络获取输入图像的区块拼接地图,并获取区块拼接地图中的每个像素的每个通道对应的值,即区块得分c;3)采用拼接算法将区块拼接地图和区块分布地图拼接组合得到物体实例的遮罩掩码;4)对所有预测物体实例的外接矩形进行处理,完成图像实例分割。与现有技术相比,本发明具有推理速度快、可扩展性强、计算耗费少、模型简洁、分割准确等优点。
  • 一种基于区块拼接实时图像实例分割方法
  • [发明专利]一种基于相似性随机混合推理的图像文本匹配方法-CN202310119172.X在审
  • 王瀚漓;陈冉 - 同济大学
  • 2023-02-15 - 2023-06-23 - G06F18/22
  • 本发明涉及一种基于相似性随机混合推理的图像文本匹配方法,根据给定的成对的图像和文本计算图像到文本局部相似性表示,将局部相似性表示输入相似性随机混合推理网络,得到推理后的局部相似性信息,进行非线性映射操作,得到全局相似性表示;相似性随机混合推理网络包括依次连接的分组映射模块、随机混合模块、多头注意力网络和前馈神经网络,局部相似性表示块进行分组映射操作后,进行拼接,拼接后的结果执行随机混合操作,将随机混合后的结果输入多头注意力网络中进行多样化关系推理,最后输入前馈神经网络中得到推理后的局部相似性信息。与现有技术相比,本发明具有推理关系全面,特征学习能力强大以及多样化交互等优点。
  • 一种基于相似性随机混合推理图像文本匹配方法
  • [发明专利]一种基于金字塔结构的光流估计方法-CN201910356481.2有效
  • 王瀚漓;孙泽锋 - 同济大学
  • 2019-04-29 - 2023-06-02 - G06T7/207
  • 本发明涉及一种基于金字塔结构的光流估计方法,包括以下步骤:构建空间金字塔孪生网络模型;构建结构金字塔网络模型,结构金字塔的各个层设置至少一个卷积神经网络,从底层到高层,卷积神经网络的数量依次递减;在光流训练集中获取一组图片对和对应的光流标签;采用空间金字塔孪生网络模型对图片对进行多尺度特征提取和下采样,并将提取的特征对输入到结构金字塔网络模型对应层的卷积神经网络中;参照光流标签,同时对空间金字塔孪生网络模型和结构金字塔网络模型进行训练和微调;在光流测试集上,使用该空间金字塔孪生网络模型和结构金字塔网络模型,获得光流测试集的预测光流场。与现有技术相比,本发明具有准确度高、效率高等优点。
  • 一种基于金字塔结构估计方法
  • [发明专利]一种高效感知视频编码优化方法-CN201910624886.X有效
  • 王瀚漓;吴秀哲 - 同济大学
  • 2019-07-11 - 2023-04-28 - H04N19/147
  • 本发明涉及一种高效感知视频编码优化方法,该方法以感知失真作为客观失真衡量指标优化HEVC编码器,包括以下步骤:1)建立基于HVS特性的感知失真模型;2)基于所述感知失真模型拟合获得感知失真所对应的码率,进而推导lambda算子,建立基于感知失真的率失真模型;3)基于所述基于感知失真的率失真模型优化HEVC编码器的编码参数。与现有技术相比,本发明具有低复杂度、高鲁棒性与高效率等优点,且能在一定程度上保持视频的感知质量。
  • 一种高效感知视频编码优化方法

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top