[发明专利]模型生成方法、模型生成装置、推理装置和存储介质在审

专利信息
申请号: 202211632833.0 申请日: 2022-12-19
公开(公告)号: CN116612301A 公开(公告)日: 2023-08-18
发明(设计)人: 山下寛泰;三宅慧;山田晃史 申请(专利权)人: 丰田自动车株式会社
主分类号: G06V10/70 分类号: G06V10/70;G06V10/82;G06N5/04;G06N3/0464;G06N3/08
代理公司: 华进联合专利商标代理有限公司 44224 代理人: 董婷婷
地址: 日本*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要: 根据本公开的模型生成方法是由计算机执行的信息处理方法,并且包括使用多个训练图像来实施推理模型的机器学习。推理模型包括压缩模块和推理模块,推理模块配置为推理针对输入图像中的子区域的任务的解。压缩模块配置为通过压缩关于包括子区域且比子区域宽的扩展区域的信息来生成压缩信息。推理模块配置为从关于子区域的信息和由压缩模块获得的压缩信息来推导任务的解。
搜索关键词: 模型 生成 方法 装置 推理 存储 介质
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于丰田自动车株式会社,未经丰田自动车株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202211632833.0/,转载请声明来源钻瓜专利网。

同类专利
  • 目标车辆的控制方法、设备及存储介质-202310798945.1
  • 叶俊荣 - 阿波罗智联(北京)科技有限公司
  • 2023-06-30 - 2023-10-27 - G06V10/70
  • 本公开提供了目标车辆的控制方法、设备及存储介质,涉及数据处理技术领域,尤其涉及人工智能、语音技术、图像处理等技术领域。具体实现方案为:响应于触发指令,确定显示屏幕中界面的界面特征;其中,所述显示屏幕为目标车辆所展示的显示屏幕;选取出与所述界面的界面特征相匹配的元素识别模式;基于与所述界面的界面特征相匹配的元素识别模式,对所述显示屏幕中的界面进行元素识别,得到多个界面元素。
  • 火花机电缆击穿点的识别方法、装置、设备及可读存储介质-202310852929.6
  • 何晓东;贺江;张宏;姜浩;王海龙;张静旖;王黎;马学武;赵燕;刘思远 - 宁夏计量质量检验检测研究院
  • 2023-07-11 - 2023-10-20 - G06V10/70
  • 一种火花机电缆击穿点的识别方法、装置、设备及可读存储介质涉及电缆加工检测设备技术领域,所述火花机电缆击穿点的识别装置包括依次设置的电缆击穿装置、传送装置、摄像装置、计数装置,利用设置的电缆击穿装置、传送装置、摄像装置、计数装置,对电缆进行击穿实验,进而检测电缆的质量,与此同时,为检测电缆上击穿点的数量,通过设置电缆击穿实验、采集电缆击穿后的影像图片、获取击穿点的位置信息以及统计击穿点数量的步骤,对电缆上的击穿点进行统计,通过运用控制装置对电缆上的击穿点进行合理统计,且避免了对击穿点的重复计数,避免了因工作量大,容易出现误差的状况,极大程度上解放了生产力。
  • 医学图像的处理方法、设备及存储介质-202310731389.6
  • 刘心茹;何丽群;王蕊;何懿;李宗正 - 深圳市普罗医学股份有限公司
  • 2023-06-19 - 2023-09-29 - G06V10/70
  • 本申请实施例提供了一种医学图像的处理方法、设备及存储介质,属于医疗互联网技术领域。该方法包括:对包括至少两个不同模态信息的医学图像子集第一医学图像集进行图像预处理,得到第二医学图像集;根据第二医学图像集中各第一医学图像的模态信息和图像特征,对第一医学图像进行组合划分,得到多个训练集和测试集,为每一训练集分配不同的第一编码解码器模型并根据训练集和测试集对对应的第一编码解码器模型进行模型训练,得到多个第二编码解码器模型以根据第二编码解码器模型的算法性能确定识别策略;根据识别策略和多个第二编码解码器模型,输出第二医学图像的病灶图像信息。本申请实施例能提升获取病灶图像信息的效率和精度。
  • 基于连续小波变换及改进残差神经网络的水下噪声识别方法-202310573352.5
  • 史文涛;金明祺;肖启阳;张群飞;陈东;刘树勋 - 西北工业大学
  • 2023-05-20 - 2023-09-12 - G06V10/70
  • 本发明提出一种基于连续小波变换及改进残差神经网络的水下噪声识别方法,首先采用变分模态分解算法对采集到的航行器自噪声信号进行分解,根据皮尔森相关系数将分解得到的若干个模态分量进行重构,从而去除自噪声信号中的冗余信息;对重构后的自噪声信号进行连续小波变换,得到其对应的时频图像,实现自噪声信号的特征提取;利用注意力机制对残差网络进行改进,构建基于注意力机制的残差神经网络,将自噪声信号的时频图像输入到网络中进行训练,实现对自噪声信号的识别分类。本发明在水下航行器自噪声信号的特征提取中解决了一维信号包含信息较少的问题,并且避免了深层神经网络精度下降问题,有效提高了不同类型噪声识别的准确率。
  • 基于困难样本挖掘的模型训练方法、设备和存储介质-202310370230.6
  • 张兆翔;王淏辰;樊峻菘;王玉玺 - 中国科学院自动化研究所
  • 2023-04-07 - 2023-09-05 - G06V10/70
  • 本发明实施例提供了一种基于困难样本挖掘的模型训练方法、设备和存储介质,涉及人工智能技术领域,该方法包括:获取当前迭代过程中基于第一图像对第一模型训练得到的模型参数,更新第二模型的模型参数;基于更新后的第二模型,确定原始图像中各图像块对应的预测重建损失;基于预测重建损失及预设困难样本需求,生成目标掩码策略;基于目标掩码策略,更新第一图像,用于下次迭代过程中对第一模型进行训练,直至第一模型的损失函数达到收敛或迭代过程的次数达到预设的迭代总次数。本发明基于第一模型的迭代训练过程,不断更新掩码策略,帮助模型学习到更具有迁移性的特征表示,提高第一模型的表征能力,避免掩码学习对人工预定义的掩码规则的依赖。
  • 一种电力行业目标检测方法及装置-202310636391.5
  • 边靖宸;李博;陈振宇;陈思宇 - 国家电网有限公司大数据中心
  • 2023-05-31 - 2023-09-05 - G06V10/70
  • 本发明涉及电力行业目标检测技术领域,具体提供了一种电力行业目标检测方法及装置,包括:获取待检测场景图像;将所述待检测场景图像作为预先训练的电力行业目标检测模型的输入,得到所述预先训练的电力行业目标检测模型输出的待检测场景图像的检测结果;所述检测结果包括下述中的至少一种:目标的位置和类别。本发明提供的技术方案,解决电力行业目标检测任务中的标注量大和训练准确性低的问题,并具备更广泛的适用性,提供了更高效、准确的目标检测解决方案,推动电力行业及其他领域的智能化发展。
  • 深度伪造反取证图像的生成方法-202310950013.4
  • 丁峰;范冰;刘帅旗;朱小刚;刘春年;刘伯成 - 南昌大学;江西炬能物联技术研究中心有限公司;南昌大学新一代信息技术产业研究院
  • 2023-07-31 - 2023-08-29 - G06V10/70
  • 本发明提供了一种深度伪造反取证图像的生成方法,涉及图像处理与多媒体信息安全技术领域。所述生成方法包括以下步骤:获取图像数据,并构建反取证模型的网络结构;将图像数据区分为训练集图像和测试集图像,将训练集图像输入生成网络并以预设权重提取视觉特征和取证特征,进行特征重组合成伪造图像;判别网络对伪造图像与训练集图像进行分类判别,并将学习到的权重回传至生成网络更新预设权重;重复进行达到预设迭代轮次后生成反取证模型;将测试集图像输入反取证模型,输出反取证图像。本发明生成的反取证图像能够提高取证检测器的检测难度,达到更强的反取证效果,从而能够协助应对新型伪造技术的取证挑战。
  • 一种移动设备上高效的细粒度图像识别方法-201910999659.5
  • 吴建鑫;刘鑫鑫;张皓 - 南京大学
  • 2019-10-21 - 2023-08-22 - G06V10/70
  • 本发明公开一种移动设备上高效的细粒度图像识别方法,首先利用高效卷积神经网络作为特征抽取器将图像的特征图抽取出来;对于特征图,利用卷积核大小为1×1的卷积操作进行升维,得到新的特征图,命名该特征图为特征图X;随后将特征图X通过全局平均池化操作以得到均值特征并对特征图X进行中心化得到特征图Y;然后将特征图Y沿着通道的方向求和得到注意力图,随后和特征图X相乘,得到用于分类的特征图Z;最后对特征图Z应用全局平均池化操作得到特征向量,进而得到分类结果。在使用阶段,只需给模型输入指定规格大小的图像,模型就会输出相应类别。由于特征抽取器和该方法需要的参数量、运算量小,模型可以实时地运行在移动设备上。
  • 一种基于CNN与PSO的双目机器人障碍特征检测方法-202010646906.6
  • 周洪成;李刚 - 金陵科技学院
  • 2020-07-07 - 2023-08-22 - G06V10/70
  • 本发明涉及一种基于CNN与PSO的双目机器人障碍特征检测方法。本发明利用机器人的多源图像数据(双目普通相机和深度相机),首先对多源数据分别进行标定处理及尺寸调整等预处理;然后使用CNN分别对双目相机与深度相机采集数据源进行识别,得到障碍物尺寸、距离等特征。由于识别会出现误差,因此对两组数据的识别结构进行加权处理,使用PSO算法寻优,计算出两组数据的最优权值,提高障碍取特征检测的准确度。通过准确检测出障碍物的特征,便于机器人及时做出准确的反应。
  • 一种图像检测的方法、装置、存储介质及电子设备-202310603865.6
  • 张文强;张舟洋;冯晋;杨倩;王朝兴 - 浙江之科云创数字科技有限公司
  • 2023-05-22 - 2023-08-11 - G06V10/70
  • 本说明书公开了一种图像检测的方法、装置、存储介质及电子设备,可以通过图像检测模型的第一识别模块从采集到的待检测图像数据中识别出包含有待检测目标物的图像区域,并且可以将包含有待检测目标物的图像区域裁剪出来,通过第二识别模块从包含有待检测目标物的图像区域中识别出包含有待检测目标物的不同指定部位的图像区域,进而可以分别针对待检测图像数据中包含待检测目标物的不同指定部位的各图像区域进行检测,从而可以提高对待检测图像数据进行图像检测的准确率。
  • 一种推理模型训练方法及装置-202210095035.2
  • 陶建军;谢凌曦;乔楠;张雷 - 华为云计算技术有限公司
  • 2022-01-26 - 2023-08-08 - G06V10/70
  • 本申请实施例涉及一种推理模型训练方法,方法可以包括:根据已标注病理图片训练得到推理模型。然后,可以根据未标注病理图片、第一病理文本以及已标注病理图片,更新推理模型。其中,推理模型用于对输入的待检测病理图片进行推理,得到待检测病理图片对应的病理结果。第一病理文本为未标注病理图片相关联的病理文本。本申请通过结合未标注病理图片、第一病理文本和已标注病理图片对推理模型进行更新,使得模型融入了更多领域经验知识,从而大大提升了推理模型对病理图片的预测准确率。
  • 基于特征的视觉SLAM语义优化算法方法及系统-202310419616.1
  • 陈凯锐;黄沛昇 - 广州大学
  • 2023-04-18 - 2023-08-04 - G06V10/70
  • 本说明书实施例提供了一种基于特征的视觉SLAM语义优化方法及系统,其中,方法包括:获取局部建图线程传入的关键帧,使用YOLOv3对局部地图进行处理,获取局部地图图像的对象位置,获取局部地图图像中对象的语义类别标签,根据所述语义类别标签的动态概率,获取图像中对象的动态概率;通过词袋模型构建关键帧与对象之间的关系;通过预设的筛选函数对关键帧进行筛选,通过设定关键帧的阈值判断是否删除该关键帧,并使局部建图线程接收新的关键帧;结合语义信息的过滤轮过滤所述对象的地图点;获取过滤后的关键帧和地图点,从而消除语义中的动态目标和不稳定信息。本申请通过消除语义概念中的动态目标和不稳定目标,从而提高SLAM系统的定位鲁棒性。
  • 图像处理模型的训练方法、装置、电子设备及存储介质-202110602898.X
  • 谢群义;陈毅;钦夏孟;章成全;姚锟 - 北京百度网讯科技有限公司
  • 2021-05-31 - 2023-08-04 - G06V10/70
  • 本公开提出了图像处理模型的训练方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉和深度学习等技术领域,可应用于图像识别场景下。具体实现方案:获取多个训练数据,并对目标搜索空间内的网络模型集合进行搜索,以得到候选网络模型,候选网络模型包括:多个计算层,并确定与多个计算层分别对应的多个敏感程度值;根据多个敏感程度值处理候选网络模型,以得到待训练网络模型,以及采用多个训练数据训练待训练网络模型,以得到图像处理模型,能够有效地简化图像处理模型的结构,从而有效地提升图像处理模型的训练效率,有效地辅助提升图像处理效果。
  • 图像识别装置-201880019314.2
  • 斋藤繁;香山信三;竹本征人;石井基范 - 松下知识产权经营株式会社
  • 2018-03-12 - 2023-08-01 - G06V10/70
  • 图像识别装置(10)具备:亮度图像生成部(3)以及距离图像生成部(4),基于从受光元件(2)输出的拍摄对象物(9)的图像信号分别生成亮度图像和距离图像;对象物识别处理部(5),利用机器学习用数据库(7),从亮度图像中提取对象物候选;以及立体物判别处理部(6),使用距离图像判别所提取的对象物候选是否为立体物,在判别为对象物候选不是立体物的情况下,在机器学习用数据库(7)中,禁止将从亮度图像中提取出的对象物候选用作用于提取对象物的特征量的图像数据。
  • 一种基于轻量化跨模态融合网络的RGB-D显著性目标检测方法-202310410912.5
  • 夏晨星;王晶晶;高修菊;葛斌;段松松;赵文俊;李续兵 - 安徽理工大学
  • 2023-04-18 - 2023-07-25 - G06V10/70
  • 本发明属于计算机视觉领域,提供了一种基于轻量化跨模态融合网络的RGB‑D显著性目标检测方法,包括以下步骤:1)获取训练和测试该任务的RGB‑D数据集,并定义本发明的算法目标2)构建用于提取RGB图像特征的编码器和深度图像特征的编码器;3)建立跨模态特点融合网络,通过渐进式引导的注意力机制增强RGB图像和深度图像特征特征的表达;4)基于上述的跨模态特征融合成的多模态特征,构建一个轻量化的全局上下文整合模块,以提取融合模态多尺度上下文特征;5)构建了一个简单高效的多路径聚合模块来整合融合特征,原始的RGB和深度图特征,并通过激活函数得到最终的预测到的显著图。
  • 图像集生成、样本集生成、自动化测试方法和装置-202310431362.5
  • 倪丙庆;侯聪聪;杜蕴璇;翟忆蒙 - 上海小度技术有限公司
  • 2023-04-20 - 2023-07-18 - G06V10/70
  • 本公开提供了一种图像集生成方法和装置,涉及人工智能技术领域,具体为计算机视觉、深度学习等技术领域。具体实现方案为:基于当前的视觉关键信息,得到当前的目标图像;将目标图像发送给智能识别交互设备,得到智能识别交互设备输出的对应下一个图像的识别需求信息;响应于包括目标图像的当前的目标图像集不满足识别需求信息的要求,基于识别需求信息,得到更新后的视觉关键信息;基于更新后的视觉关键信息,得到下一个图像,并通过下一个图像更新目标图像集。该实施方式提高了视觉相关资源的生成效率。
  • 一种自适应智能图像处理系统-201910039707.6
  • 李浩;胡继明;徐洁;陆峥 - 李浩
  • 2019-01-16 - 2023-07-18 - G06V10/70
  • 本发明提供一种自适应智能图像处理系统,包括:分类模块、处理模块,待处理图像通过转换函数变为具有关键参数的系数模式,然后通过分类模块按照算法进行分类,接着处理模块对已分类的图像按照不同的算法进行处理,处理后的结果再次转换为系数模式与处理前系数模式比较,并将比较结果反馈至处理模块与分类模块,利用其结果不断优化处理模块与分类模块。本发明利用机器学习算法,建立的分类模块可以有效地帮助操作人员选择合适的处理方法,减少操作步骤;处理模块通过前端反馈可以不断的优化其处理结果,提高处理结果。
  • 基于库位的货物识别方法、无人叉车及存储介质-202310090651.3
  • 杨秉川;方牧;鲁豫杰;李陆洋;李汉邦;方晓曼 - 未来机器人(深圳)有限公司
  • 2023-01-29 - 2023-06-23 - G06V10/70
  • 本申请提供一种基于库位的货物识别方法、无人叉车及存储介质,其中所述方法包括:通过视觉检测装置获取第一库位图像,所述第一库位图像包括至少一个库位区域,所述库位区域用于指示待识别库位在仓库中用于堆叠货物的空间;对所述第一库位图像中的库位区域进行识别,得到识别结果,所述识别结果至少包括所述待识别库位上是否堆叠有货物;将所述识别结果发送给中控系统,使得所述中控系统对所述待识别库位进行货物管理。采用本申请,能够解决现有技术中存在的货物搬运效率降低、引起安全隐患等问题。
  • 一种板式换热器内气泡的目标检测方法-202010144170.2
  • 李孝禄;汪迁文;许沧粟;李运堂;陈源 - 中国计量大学
  • 2020-03-04 - 2023-06-20 - G06V10/70
  • 本发明公开了一种板式换热器内气泡的目标检测方法,旨在解决传统检测方法检测流程复杂,计算量大,检测效果不佳的技术问题。本发明通过高速摄像机拍摄下板式换热器内两相流流动视频制作气泡数据集;利用Darknet学习框架,采用YoLov3‑tiny模型,通过迁移学习冻结全连接层前的参数,利用该模型作为特征提取器;把场景中目标检测问题作为目标的回归预测问题;增设改进三帧差法,提高其识别率;利用IoU分数筛选算法去除重复的候选框,从而得到最终检测结果。本发明在使用迁移学习后图像特征的计算量减小、检测流程精简、检测速度快、网络的识别精度提高、检测结果也更加全面。
  • 一种基于动态裁剪的模型推理加速方法-202211676368.0
  • 李艺强;吴钟建;金代中;陈陶;王升哲;罗镇宝;关炜;康朋新;郑杰;张毅;崔雨勇;赵径通 - 西南技术物理研究所
  • 2022-12-26 - 2023-06-09 - G06V10/70
  • 本发明提出一种基于动态裁剪的模型推理加速方法,该方法应用于模型推理阶段,首先训练优化好模型进行推理,然后输入数据计算模型当前层的通道注意力,之后根据注意力分布情况进行动态过滤,将作用小或不起作用的通道对应的下层卷积结果使用全0代替,屏蔽非必要的卷积运算,其余的通道正常进行卷积运算,最后每层的运算重复上一步骤完成整个模型的推理过程。推理过程中每层动态屏蔽部分卷积运算,使得整个模型推理速度得以提升。本发明提出的动态裁剪加速方法是根据输入数据不同,模型在推理过程中对于每个特征通道的侧重点不同,屏蔽低权重通道的卷积计算实现加速推理。
  • 图像描述的方法、装置、电子设备及存储介质-202010065500.9
  • 王震;刘涛 - 北京百度网讯科技有限公司
  • 2020-01-20 - 2023-06-09 - G06V10/70
  • 本申请公开了图像描述的方法、装置、电子设备及存储介质,涉及图像处理技术领域。具体实现方案为:获取目标图像;通过N个图像识别模型对所述目标图像进行识别以生成所述目标图像的M个基础特征,其中,N为正整数,M为小于或等于N的正整数;根据所述M个基础特征,生成M个基础特征标签;根据所述M个基础特征标签生成所述目标图像的图像描述语句,通过这种方式生成的图像描述语句具有更丰富的表现能力,能够充分表现出目标图像中的信息,提高了图像描述语句的准确性和可靠性。
  • 目标检测方法、装置、电子设备及存储介质-202211698330.3
  • 高声荣;曾卓熙;肖嵘;王孝宇 - 深圳云天励飞技术股份有限公司
  • 2022-12-28 - 2023-06-02 - G06V10/70
  • 本发明实施例提供一种目标检测方法,通过训练好的特征提取器对待检测图像进行特征提取,得到所述待检测图像的目标特征;通过训练好的通道分配器对所述目标特征进行通道分配,得到分配后的目标特征,所述通道分配器与分配后的所述目标特征一一对应;将分配后的所述目标特征分配到对应的所述检测器进行检测,得到所述待检测图像的目标检测结果,所述通道分配器至少与一个所述检测器对应。通过将待检测图像的目标特征进行通道分配,使得分配后的目标特征更适应于不同的检测器,利用通道分配解决不同检测任务的特征冲突问题,从而提高了目标检测的性能。
  • 一种基于施工大数据的AI辅助决策和管理优化服务系统-202310112844.4
  • 揭臣兵;刘泽;耿建委;邓书舫;薛大川;李栋;王成印;张晓娟 - 中建电子信息技术有限公司
  • 2023-02-15 - 2023-05-26 - G06V10/70
  • 本发明公开了一种基于施工大数据的AI辅助决策和管理优化服务系统,包括:获取模块,用于基于数据采集节点矩阵获取施工大数据;确定模块,用于对施工大数据进行分类,确定若干个子数据;匹配模块,用于:基于每个子数据的数据类型匹配相应的处理平台;基于每个子数据的数据特征匹配相应的数据处理算法,并将数据处理算法传输至对应的处理平台;处理平台,用于基于数据处理算法对子数据进行处理,得到处理子数据并传输至融合模块;融合模块,用于将处理子数据进行融合处理,得到目标数据。实现对大量智能设备的有效管理,提高数据采集的准确性,同时对采集的数据进行分布式处理,提高了资源利用率,也提高了对数据处理效率。
  • 基于远程过程调用和元学习的图像分类模型选择系统-202310424363.7
  • 刘艺;郑奇斌;李庚松;秦伟;李翔;刘坤;刁兴春 - 北京大数据先进技术研究院
  • 2023-04-20 - 2023-05-23 - G06V10/70
  • 本发明提供了一种基于远程过程调用和元学习的图像分类模型选择系统,涉及算法选择技术领域,旨在解决算法选择技术仅停留在理论实验阶段的问题,以落实于工程应用。所述系统包括:客户端、服务端和存储端;所述客户端展示微服务界面,并获取用户账户在所述微服务界面设置的微服务参数,将所述微服务参数传输给所述服务端;所述服务端根据所述微服务参数和图像数据集,运行所述微服务参数对应的微服务,并将所述微服务的运行结果的信息返回所述客户端;所述客户端对所述微服务的运行结果的信息进行展示;所述存储端存储所述客户端传输的图像数据集,并将图像数据集传输给所述服务端。
  • 一种基于深度稀疏滤波卷积神经网络的驾驶行为识别方法-201710232371.6
  • 王忠民;衡霞;张瑶;韩帅;王希 - 西安邮电大学
  • 2017-04-11 - 2023-05-09 - G06V10/70
  • 本发明公开了一种基于深度稀疏滤波卷积神经网络的驾驶行为识别方法。解决了传统深度学习方法中需要大量的超参数调谐进行特征匹配或特征设计任务的问题。包括以下步骤:用手机内置的加速度传感器采集车辆行驶中的原始三轴加速度数据信号,提取时域和频域的特征值,作为模型的预处理训练样本;将训练样本通过稀疏滤波直接优化样本特征映射的稀疏性,获取更好的特征表达——权值矩阵作为卷积神经网络的输入,可有效识别点火、熄火、匀速行驶、急变速、急转弯、静止等驾驶行为。本发明解决了现有技术设计复杂、普适性和抗噪性差,分类精度低的问题。
  • 视觉常识推理方法和装置、存储介质及电子设备-202310032508.9
  • 李晓川;李仁刚;郭振华;赵雅倩;范宝余 - 苏州浪潮智能科技有限公司
  • 2023-01-10 - 2023-04-25 - G06V10/70
  • 本申请实施例提供了一种视觉常识推理方法和装置、存储介质及电子设备,涉及计算机领域,其中,该方法包括:获取目标图像的图像检测特征、目标问句的问句文本特征、第一候选答案的第一答案文本特征;将图像检测特征、问句文本特征和第一答案文本特征输入到N层抗噪注意力模块,得到目标图像的图像注意力特征、目标问句的文本修复筛选特征、第一候选答案的答案文本空间特征;将问句文本特征和文本修复筛选特征进行叠加,得到目标问句的文本降噪特征;根据图像注意力特征、文本降噪特征以及答案文本空间特征,确定目标推理结果。
  • 一种多模式情绪识别方法、装置及计算机可读存储介质-201811151831.3
  • 贾雪丽;王全;王健宗;肖京 - 平安科技(深圳)有限公司
  • 2018-09-29 - 2023-04-18 - G06V10/70
  • 本方案涉及人工智能,提供了一种多模式情绪识别方法、装置及计算机可读存储介质,多模式情绪识别方法包括:分别获得视频中的音频模式、视频模式和文本模式的话语的单峰特征,用RNN建立上下文模型,从音频模式、视频模式和文本模式的单峰特征中分别提取情境感知单峰特征;用全连接层连接音频模式、视频模式和文本模式的情境感知单峰特征,产生融合的双峰特征向量,用RNN建立上下文模型,从双峰特征向量中提取情境感知双峰特征;用全连接层将这些情境感知双峰特征组合成三模式特征向量,用RNN建立上下文模型,进一步提取情境感知三模式特征。本发明能更加准确的提高的提取出可用于情感分类的特征向量。
  • 一种目标的快速检测方法及装置-201910174066.5
  • 刘若堃;肖立波;张涛 - 旺微科技(浙江)有限公司
  • 2019-03-08 - 2023-04-11 - G06V10/70
  • 本发明公开了一种目标的快速检测方法,方法包括:1)、获取待检测图像,以及针对待检测图像的检测框尺寸,且检测框尺寸不大于待检测图像的尺寸;2)、将特征子集的特征权重与比值对应的其他特征子集的特征权重合并;3)、计算每一个特征子集的积分值;4)、判断检测框区域内的特征子集的积分值是否大于设定门限值;5)、若是,按照检测框的滑动方向,将检测框滑动第一步长,并返回执行步骤3),直至待检测图像中的目标被检测完成;6)、若否,按照检测框的滑动方向,将检测框滑动第二步长并返回执行步骤3),直至待检测图像中的目标被检测完成。本发明公开了一种目标的快速检测装置。应用本发明实施例,可以降低运算复杂度。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top