[发明专利]智能座舱环境下司机状态文本的生成方法及相关设备在审

专利信息
申请号: 202310905528.2 申请日: 2023-07-24
公开(公告)号: CN116935063A 公开(公告)日: 2023-10-24
发明(设计)人: 胡敏;宁欣;唐小江;李爽;周嵘;候旭晴;李冬冬 申请(专利权)人: 北京中科睿途科技有限公司
主分类号: G06V10/42 分类号: G06V10/42;G10L15/26;G06V10/80;G06V10/82;G06N3/0464;G06N3/08
代理公司: 北京万驰专利代理事务所(普通合伙) 16106 代理人: 郭永
地址: 102627 北京市大兴*** 国省代码: 北京;11
权利要求书: 暂无信息 说明书: 暂无信息
摘要: 发明公开了一种智能座舱环境下司机状态文本的生成方法及相关设备,该方法包括:获取智能座舱环境中司机的RGB图像、红外图像和语音数据;基于预设图像编码器对RGB图像和红外图像进行特征提取,获取图像编码特征;对语音数据进行语音识别,并基于预设文本编码器对识别到的文本数据进行编码,获取文本编码特征;根据图像编码特征和文本编码特征生成融合特征;基于预设文本解码器对融合特征进行解码,生成与司机状态对应的文本信息,通过对RGB图像、红外图像和语音数据进行特征提取和特征融合,结合三种不同维度进行状态文本生成,从而提高了描述智能座舱环境下司机状态的文本的准确性,进而可更加准确的对司机状态进行监测。
搜索关键词: 智能 座舱 环境 司机 状态 文本 生成 方法 相关 设备
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中科睿途科技有限公司,未经北京中科睿途科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202310905528.2/,转载请声明来源钻瓜专利网。

同类专利
  • 图像处理方法、装置、电子设备及存储介质-202310417354.5
  • 李德辉 - 腾讯科技(深圳)有限公司
  • 2023-04-11 - 2023-10-27 - G06V10/42
  • 本申请提供一种图像处理方法、装置、计算机可读存储介质、计算机程序产品,该图像处理方法包括:对图像进行特征提取,得到所述图像的三维特征图;融合所述三维特征图在不同维度上的卷积特征,得到所述图像的全局特征图;其中,所述三维特征图在不同维度上的卷积特征是基于所述三维特征图进行维度转置处理后进行卷积处理所得到的;对所述全局特征图进行池化处理,得到所述图像的图像特征。本申请实施例的技术方案能准确获取的表征图像信息的图像特征,图像处理计算量小、效率高。
  • 一种基于图像的信息处理方法及相关装置-202310447920.7
  • 刘绍腾 - 腾讯科技(深圳)有限公司
  • 2023-04-17 - 2023-10-27 - G06V10/42
  • 本申请公开一种基于图像的信息处理方法及相关装置,应用于人工智能;通过样本图像、样本信息的第三编码图像和样本密钥的第四编码图像对可逆神经网络进行正向的信息嵌入训练和逆向的信息提取训练得到信息处理模型。获取待嵌入图像、待嵌入信息的第一编码图像和预设密钥的第二编码图像,将前述两个编码图像分别输入信息处理模型中的预设嵌入层进行正向的特征表示得到第一正向特征图像和第二正向特征图像;结合待嵌入图像经过正向的第一运算得到已嵌入图像。将已嵌入图像分别输入信息处理模型中的第一特征提取层和第二特征提取层进行逆向的特征提取得到第一逆向特征图像和第二逆向特征图像;结合第二编码图像经过逆向的第二运算得到第一编码图像。
  • 智能座舱环境下司机状态文本的生成方法及相关设备-202310905528.2
  • 胡敏;宁欣;唐小江;李爽;周嵘;候旭晴;李冬冬 - 北京中科睿途科技有限公司
  • 2023-07-24 - 2023-10-24 - G06V10/42
  • 本发明公开了一种智能座舱环境下司机状态文本的生成方法及相关设备,该方法包括:获取智能座舱环境中司机的RGB图像、红外图像和语音数据;基于预设图像编码器对RGB图像和红外图像进行特征提取,获取图像编码特征;对语音数据进行语音识别,并基于预设文本编码器对识别到的文本数据进行编码,获取文本编码特征;根据图像编码特征和文本编码特征生成融合特征;基于预设文本解码器对融合特征进行解码,生成与司机状态对应的文本信息,通过对RGB图像、红外图像和语音数据进行特征提取和特征融合,结合三种不同维度进行状态文本生成,从而提高了描述智能座舱环境下司机状态的文本的准确性,进而可更加准确的对司机状态进行监测。
  • 货物识别方法、装置、设备和存储介质-202210351931.0
  • 袁文静 - 深圳顺丰泰森控股(集团)有限公司
  • 2022-04-02 - 2023-10-24 - G06V10/42
  • 本发明公开了一种货物识别方法、装置、设备和存储介质,其方法包括:获取待识别货物的货物特征;根据货物特征,确定待识别货物的目标任务类型,根据目标任务类型,确定目标货物识别器,基于目标货物识别器,对货物特征进行识别,得到待识别货物的识别结果;如此,根据待识别货物的货物特征,确定待识别货物的目标任务类型,根据目标任务类型,选择适配的目标货物识别器,提升了货物识别的准确度。
  • 目标提取方法、装置、电子设备及存储介质-202310930932.5
  • 王雷;陈铖;于博;陈方 - 中国科学院空天信息创新研究院
  • 2023-07-27 - 2023-10-17 - G06V10/42
  • 本公开提供了一种目标提取方法、装置、电子设备及存储介质,包括:获取待测卫星遥感影像;对待测卫星遥感影像进行预处理,得到多个预置像素大小的斑块;对于每一斑块,执行以下操作:将斑块输入至编码器,输出第一特征图;将第一特征图输入至解码器,解码器包含多次上采样和多次融合编码器的中间特征图和解码器的中间特征图的全局局部提取操作,包括:对输入特征图进行归一化以及卷积操作以从输入特征图中提取局部特征,得到第一特征集;基于多头自注意机制从输入特征图中提取全局特征,得到第二特征集;以及对第一特征集和第二特征集进行处理及融合,得到第二特征图,其中,第二特征图包括识别出的多个目标。编码器和解码器构成Global‑Local‑Attenion网络结构。
  • 鸟瞰图特征的确定方法、图像处理方法、装置和设备-202310859576.2
  • 尹浩然;张骞;隋伟 - 地平线(上海)人工智能技术有限公司
  • 2023-07-12 - 2023-10-10 - G06V10/42
  • 本公开实施例公开了一种鸟瞰图特征的确定方法、图像处理方法、装置和设备,其中,方法包括:基于至少一个视角中各视角分别对应的待处理图像,确定各视角分别对应的第一图像特征;基于各第一图像特征和第一鸟瞰图查询特征,进行基于局部窗口的交叉注意力操作,获得第一注意力结果;基于第一注意力结果,确定第二鸟瞰图查询特征;基于第二鸟瞰图查询特征和各第一图像特征,进行基于局部和全局窗口的交叉注意力操作,获得第二注意力结果;基于第二注意力结果,确定至少一个视角对应的目标鸟瞰图特征。本公开实施例通过窗口的切分可以大大降低交叉注意力操作的计算复杂度,通过局部交互和全局交互可以有效提高鸟瞰图特征的准确性和有效性。
  • 一种化合物逆合成方法及装置-202211454720.6
  • 侯静怡;刘志杰;贺威;苏磊;孟献兵 - 北京科技大学
  • 2022-11-21 - 2023-10-10 - G06V10/42
  • 本发明提供了一种化合物逆合成方法及装置,涉及逆合成技术领域,特别指一种结合多尺度卷积与自注意力编码的化合物逆合成方法及装置。包括通过基于Transformer的序列模型提取原化合物的化学分子式特征;通过多尺度卷积模块,对化学分子式特征进行多尺度局部特征和差分特征提取;将多尺度局部特征和差分特征输入至基于注意力机制的GRU的序列生成模型,进行原化合物的回归生成,完成化合物逆合成。本发明提出的化合物逆合成方法在降低化合物研发成本、提高化合物研发效率的场景下具有显著的应用价值,为实现全面、准确的化合物逆合成以及化合物合成的广泛应用奠定了模型基础。
  • 基于点云的事件驱动信息处理方法-202310705549.X
  • 程伯骏;任宏伟;周悦 - 香港科技大学(广州)
  • 2023-06-14 - 2023-09-29 - G06V10/42
  • 本发明公开了一种数据转换方法、事件驱动信息处理方法、特征提取器以及基于点云的脉冲神经网络SpikePoint。为解决现有基于事件相机进行动作识别难以同时实现高效、轻量级、低功耗和高精度的商业需求,本发明直接处理原始点云数据,有效地提取事件云的全局和局部特征,并维持点云的顺序不变,并通过脉冲的方式传递信息,由脉冲神经网络进行推理。本发明擅长处理原始事件云数据,并保留了有价值的时空信息,提升了动作识别的准确性和性能,同时基于残差连接和瓶颈方法,实现轻量级设计的同时,维持高实时性、高精度和低功耗。本发明适于类脑芯片、边缘计算、事件相机及计算机视觉领域。
  • 一种在可见光-红外图像弱对齐下的目标检测方法-202310754391.5
  • 王青旺;池永柯;沈韬;刘佳丽;欧阳俊林 - 昆明理工大学
  • 2023-06-26 - 2023-09-19 - G06V10/42
  • 本发明涉及一种在可见光‑红外图像弱对齐下的目标检测方法,属于基于深度学习的图像处理技术领域。将可见光和红外图像输入到特征提取网络中,提取可见光和红外图像的全局特征;将可见光图像输入到光照感知模块中,提取光照信息;将可见光和红外图像特征输入到多尺度空间对齐模块中进行特征对齐,得到在同一潜在物理空间下对齐的可见光和红外图像特征;将可见光和红外图像特征输入到特征融合模块中,融合可见光和红外图像特征的目标互补信息,得到融合后的特征图;将光照信息和特征图输入到检测器进行目标检测。本发明能有效在特征层面对齐可见光和红外图像各维度特征,增强目标检测器对各维度信息不对齐的可见光和红外图像的检测鲁棒性。
  • 目标检测方法、装置、电子设备、计算机可读存储介质-202310397226.9
  • 吕文玉;赵祎安;徐尚良;王冠中;党青青 - 北京百度网讯科技有限公司
  • 2023-04-12 - 2023-09-05 - G06V10/42
  • 本公开提供了目标检测方法、装置、电子设备、计算机可读存储介质,涉及图像处理技术领域,尤其涉及深度学习、目标检测技术领域。具体实现方案为:对待检测图像进行多尺度特征提取,获取多个对应不同尺度的尺度特征,多个所述尺度特征包括一个深层特征和至少一个浅层特征,所述浅层特征对应的尺度小于所述深层特征对应的尺度;基于多个所述尺度特征,进行交叉注意力计算,获取全局语义特征;将所述全局语义特征与所述浅层特征进行特征融合,获取检测特征;根据所述检测特征获取所述待检测图像中的目标类别以及目标位置。
  • 图像特征提取方法、设备及可读存储介质-202310545790.0
  • 张号逵;汤步洲 - 深圳云天励飞技术股份有限公司
  • 2023-05-15 - 2023-08-29 - G06V10/42
  • 本申请公开一种图像特征提取方法、设备及可读存储介质,属于图像处理领域。方法包括:获取待提取特征的原始图像,再将原始图像输入至特征提取模型中进行特征提取,输出原始图像的第一图像特征。其中,特征提取模型包括依次连接的多个局部特征提取结构和ViT结构,ViT结构用于根据ViT结构的上一层结构输出的第二图像特征、以及多个局部特征提取结构中目标局部特征提取结构输出的第三图像特征,确定第一图像特征。由于第三图像特征为对像素空间位置信息敏感的局部特征,因此通过ViT结构根据第三图像特征确定的第一图像特征也具有较强的像素空间位置敏感性,如此可以提升ViT结构的可适用性,扩大ViT结构即特征提取模型的应用场景。
  • 移动端实时目标检测方法、终端设备及存储介质-202310661782.2
  • 刘金平;刘贤义;徐鹏飞;赵俊淇;邓佑锟;杨广益 - 湖南师范大学
  • 2023-06-06 - 2023-08-29 - G06V10/42
  • 本发明公开了一种移动端实时目标检测方法、终端设备及存储介质,目标检测方法包括对输入的特征图分通道提取特征后进行拼接,得到信息交互后的特征图;将信息交互后的特征图分为第一通道和第二通道;利用PGConv模块提取第一通道中的局部特征,利用PGConv模块和ShiftMLP模块分别提取第二通道中的局部特征和全局特征;拼接第一通道中的局部特征以及第二通道中的局部特征和全局特征,得到目标的特征。本发明的移动端实时目标检测方法,能够解决通道无法相互通信的问题,同时能够大量的降低计算量与参数量,可在移动端获取精确的目标检测结果。
  • 一种基于语义分割的雾培番茄特征提取方法-202211578932.5
  • 董俊;朱智佳;马凡;吴双 - 中国科学院合肥物质科学研究院;安徽中科德技智能科技有限公司
  • 2022-12-05 - 2023-08-25 - G06V10/42
  • 本发明提供一种基于语义分割的雾培番茄特征提取方法,涉及无土栽培领域。该基于语义分割的雾培番茄特征提取方法,输入植物叶片的图片;对输入的图片进行预处理;将预处理后的图片传输到编码器用于提取特征,通过ResNet网络用以提取图像局部抽象特征,在ResNet网络的ResLayer结构的残差融合之前且最后一个卷积之后添加上下文模块,通过上下文模块用以叠加图像全局上下文信息;将提取的特征传输到解码器用于融合及解码特征,针对小目标优化的ASPP用于解码粗粒度特征,通过动态核更新机制用以将粗粒度特征转换为细粒度特征,通过主分类器用以将特征信息映射至分类信息,完成分类,有效提高了分割精度,满足后续植物生长状态判别对于叶片及根系分割精度的要求。
  • 特征提取方法、生物对象部位的状态识别方法及电子设备-202310603835.5
  • 许静;黄凯;赵爽;王宇;高远;刘伟;周彦捷;吕乐 - 阿里巴巴达摩院(杭州)科技有限公司
  • 2023-05-22 - 2023-08-15 - G06V10/42
  • 本申请公开了一种特征提取方法、生物对象部位的状态识别方法及电子设备。其中,该方法包括:获取生物对象的多模态数据,其中,多模态数据至少包括:图像数据和文本数据,图像数据是通过图像传感器和/或光学仪器对生物对象的目标部位进行图像采集得到的图像,文本数据是对生物对象和目标部位在预设时间段内的状态进行描述的数据;分别对图像数据和文本数据进行特征提取,得到图像数据的全局特征和局部特征,以及文本数据的全局特征;对图像数据的全局特征和局部特征,以及文本数据的全局特征进行特征融合,得到多模态数据的多模态特征。本申请解决了相关技术中通过影像数据对皮肤状态进行识别的准确率较低的技术问题。
  • 一种基于自注意力机制的点云特征点提取方法及系统-202310214440.6
  • 聂建辉;刘升 - 南京邮电大学
  • 2023-03-07 - 2023-08-15 - G06V10/42
  • 本发明公开了一种基于自注意力机制的点云特征点提取方法及系统,该方法包括获取点云模型的点云切片;将所述点云切片输入至神经网络中,获得多通道的特征邻域;将所述多通道的特征邻域进行MLP计算,并将计算结果进行自注意力机制计算,获得全局特征;将全局特征依次进行最大池化计算、MLP计算及FNN计算,获取点云切片中心点为特征点的概率。本发明通过点云切片获取多通道的特征邻域,多通道的特征邻域除点云的空间位置信息外,还包括欧氏距离信息及中心点邻域信息,获得了更多的语义信息,结合自注意力机制计算并经过后处理,降低了输出的维度,减少了后续特征映射的计算量;可方便高效的获取特征点。
  • 基于transformer的全景图像特征表示学习方法-202310309313.4
  • 周向东;凌致新 - 复旦大学
  • 2023-03-27 - 2023-06-27 - G06V10/42
  • 本发明提供了一种基于transformer的全景图像特征表示学习方法,包括:将第一全景图像划分为若干方格,用多层深度卷积神经网络提取各方格的特征,得到各方格的第一特征向量;基于方格划分若干第一窗口,对各第一窗口内的所有方格进行自注意力操作,得到各方格的第二特征向量;使整张第一全景图像的所有方格经过滑动变换及自注意力操作,得到各方格的第三特征向量;将复制后的第一全景图像进行90°的俯仰角旋转得到第二全景图像,进行交叉注意力操作,得到各方格的第四特征向量;基于获取的特征向量,以每四个相邻的方格的特征作为一组进行合并,得到第一全景图像的处理后特征。本发明克服了全景图像的空间畸变问题和边界不连续问题。
  • 基于图像多尺度特征的视差图生成方法及装置-202310287120.3
  • 侯本玉 - 中国工商银行股份有限公司
  • 2023-03-22 - 2023-06-23 - G06V10/42
  • 本发明实施例公开了一种基于图像多尺度特征的视差图生成方法及装置,可用于金融领域或其他技术领域,该方法包括:将左图像和右图像分别输入到主干特征提取模块,得到所述左图像以及所述右图像各自对应的多尺度特征图;根据所述左图像和所述右图像各自对应的多尺度特征图生成多尺度匹配代价体;对所述多尺度匹配代价体从最小尺度开始逐级向上融合,得到初始匹配代价体;将所述左图像和所述右图像进行通道叠加得到匹配代价体,然后将该匹配代价体输入到平滑特征提取模块中,得到平滑特征图;将所述平滑特征图与所述初始匹配代价体进行融合,得到融合代价体;根据所述融合代价体生成视差图。本发明有助于提高视差预测的精度。
  • 单应性矩阵估计方法、电子设备、存储介质及程序产品-202310107729.8
  • 江海;李海鹏;刘渝桥;刘帅成 - 北京迈格威科技有限公司
  • 2023-01-31 - 2023-06-20 - G06V10/42
  • 本发明实施例提供一种单应性矩阵估计方法、电子设备、存储介质及程序产品。方法包括:获取待处理源图像和待处理目标图像;将获取的图像输入单应性矩阵估计网络中,获得图像之间的单应性矩阵,上述网络通过以下方式训练获得:获取样本源图像和样本目标图像;对于至少一组目标单应性矩阵中的每组目标单应性矩阵,通过其中的每个目标单应性矩阵,对待扭曲图像进行图像扭曲,获得中间态图像;对于至少一组训练图像中的每组训练图像,将该组训练图像中的每个图像对输入上述网络,获得与该组训练图像中的图像对一一对应的预测单应性矩阵;计算总预测损失;基于总预测损失对网络中的参数进行优化。该方案能够准确求解大基线场景下的单应性矩阵。
  • 学习图像中的对象的注释-201780075488.6
  • D·N·兹纳缅斯基;K·西戈德尔;M·范德里 - 皇家飞利浦有限公司
  • 2017-12-05 - 2023-06-20 - G06V10/42
  • 提供一种系统和方法,其使用机器学习算法以多尺度图像的一个或多个尺度来获得所学习的对象的注释。提供用于观察所述多尺度图像的观察窗口(300)。所述观察窗口是基于放大系数和空间偏移参数可配置的,所述放大系数选择多个尺度中的一个用于观察。用户可以提供所述观察窗口中的对象的手动注释,所述手动注释然后用作所述机器学习算法的学习中的训练反馈。为了使得用户能够更有效地提供所述手动注释,针对所述观察窗口的所述放大系数和所述空间偏移参数可以被自动确定,即通过系统和方法确定在所述多尺度图像中何处所述对象的所述手动注释将会对由所述机器学习算法提供的所学习的注释具有足够的影响。所确定的影响可以以叠加(350)的形式被示出在所述观察窗口中。
  • 一种脑图像处理方法、设备和存储介质-202310132535.3
  • 汪天富;邱梓锋;雷柏英;杨鹏;宋雪刚 - 深圳大学
  • 2023-02-08 - 2023-06-09 - G06V10/42
  • 本发明涉及图像处理技术领域,具体是涉及一种脑图像处理方法、设备和存储介质。本发明首先基于残差网络结构将一张原始脑图像划分成多种尺度的多张子图像,同时提取每张子图像的初始特征图。然后用卷积算法对每一张初始特征图进一步提取其局部特征。之后将多个尺度的个性特征图进行融合就得到了共性特征图。由于本发明使用残差网络结构得到的多个尺度的初始特征图涵盖了原始脑图像的全局特征,而使用卷积得到的个性特征图又涵盖了局部特征,因此融合之后的共性特征图既有原始脑图像的全局特征又有局部特征,所以基于共性特征图得到的融合特征图更能准确反映出原始脑图像的特征。
  • 点云特征提取方法、计算机设备及存储介质-202310137160.X
  • 凌强;周策;何欣栋;姚卯青 - 中国科学技术大学;安徽蔚来智驾科技有限公司
  • 2023-02-10 - 2023-06-06 - G06V10/42
  • 本公开涉及三维视觉技术领域,具体公开了一种点云特征提取方法、计算机设备及存储介质,所述方法包括:根据点云中待处理的目标点的空间坐标,确定所述目标点第一预设空间范围内的相邻点;根据所述相邻点的特征信息确定所述目标点的局部特征,利用所述目标点的局部特征更新所述目标点的特征,得到更新后目标点的特征;获取所述点云的全局特征,所述全局特征基于从所述点云中选取的关键点的特征信息得到;将所述更新后目标点的特征和所述全局特征按照第一预设方式进行融合,得到所述目标点的提取特征。本公开使得点云既简单有效地融合局部上下文信息,又基于关键点减少复杂度,更有效地融合全局上下文信息,得到点云最终的提取特征。
  • 一种基于结构化特征提取的多模特征关联方法-202310046442.9
  • 张小国;胡桐飞;李尚哲;邓奎刚;王慧青 - 东南大学
  • 2023-01-31 - 2023-05-26 - G06V10/42
  • 本发明公开了一种基于结构化特征提取的多模特征关联方法,从双目图像提取点线特征,并通过线特征估算平面特征,随后利用特征间的空间几何关系构建不同特征之间的关联关系。主要包括以下几个步骤:先提取点、线特征,再根据可靠的线特征估算相交线的平面特征,随后利用特征间的空间几何关系构建不同特征之间的关联关系并创建语义地图,最后将关联关系与后端结合,对系统进行优化。本发明改进了利用线特征估算平面的算法,给出了特征间空间几何关系的数学模型,并将关联关系用于SLAM系统后端优化,减少系统的累计误差,提供了更好的定位能力。
  • 一种基于深度相机的发动机缸体孔径尺寸测量方法-202310234324.0
  • 汪俊;贾文茹;李子宽;吴翔 - 南京航空航天大学
  • 2023-03-13 - 2023-05-16 - G06V10/42
  • 本发明涉及发动机缸体孔径尺寸测量技术领域,解决了目前提取发动机缸体上圆的方法无法相互协同,而导致对于孔径尺寸测量困难、精度低且存在局限性的技术问题,尤其涉及一种基于深度相机的发动机缸体孔径尺寸测量方法,包括以下步骤:S1、通过深度相机获取待处理发动机缸体的点云深度图、RGB图和点云渲染图;S2、将点云深度图、RGB图和点云渲染图输入至点云深度融合网络得到多源深度融合图像;S3、将多源深度融合图像输入至深度图像检测网络中进行目标分类与特征提取得到检测结果。本发明提高了点云特征提取的准确性,有效提升了对孔的检测识别能力,解决了缸体孔径检测困难的问题。
  • 单样本自适应域生成器迁移方法-202210811744.6
  • 左旺孟;张亚博;姚明帅;魏于翔 - 哈尔滨工业大学
  • 2022-07-11 - 2023-05-05 - G06V10/42
  • 单样本自适应域生成器迁移方法,涉及就三级视觉中的图像生成和迁移学习领域。解决了使用现有的算法迁移后的目标生成器无法准确获取引导图风格及迁移后的图片多样性低的问题。本发明方法通过全局水平域迁移损失函数使迁移后的目标域生成器合成的图片拥有引导图的全局特征;设计了局部水平域迁移损失函数来解决现有技术无法准确获取引导图局部代表性特征的问题;利用逆映射器把合成图片映射到隐空间,并提出自适应属性保持损失函数来自适应的挑选和保持域共享的属性,从而使迁移后的图片保持了之前图片的部分属性,提高了合成图片的多样性,并通过给定一张目标域引导图即可实现对自适应域生成器的迁移。主要用于实现对自适应域生成器的迁移。
  • 图像特征提取方法、装置、计算机设备和存储介质-202310164922.5
  • 郑喜民;先健铭;舒畅;陈又新 - 平安科技(深圳)有限公司
  • 2023-02-16 - 2023-04-28 - G06V10/42
  • 本申请属于人工智能的机器学习技术领域,特别涉及一种图像特征提取方法、装置、计算机设备和存储介质。方法包括:获取待处理的输入图像;对输入图像进行预处理,获得去噪图像;将输入图像输入第一卷积神经网络,获得第一特征图;将去噪图像输入第二卷积神经网络,获得第二特征图;根据第一特征图获得第一矩阵(Q矩阵)和第二矩阵(V矩阵);根据第二特征图获得第三矩阵(K矩阵);根据第一、第三矩阵,获得第四矩阵;根据第二、第四矩阵,获得目标特征图。上述的方法、装置、计算机设备和存储介质可提高目标特征图的特性。可用于金融领域票据识别、自动理赔;医疗领域的病例数据提取、医疗影像读取等。
  • 基于Transformer的图像处理方法及其系统-202310064058.1
  • 赵广艺;李勇周;谭红梅 - 中国科学院微电子研究所;许昌市投资集团有限公司
  • 2023-01-12 - 2023-04-25 - G06V10/42
  • 本发明提供一种基于Transformer的图像处理方法及其系统,其中图像处理方法包括:获取图像样本;通过卷积神经网络对图像样本进行局部特征提取,得到二维特征图;将二维特征图转化为第一一维特征序列;将第一一维特征序列中的特征向量与第一位置编码相加,得到第一一维编码特征序列;通过Transformer对第一一维编码特征序列进行全局特征提取,得到一维待处理特征序列;将一维待处理特征序列作为输入进行至少一次叠加操作,以使一维待处理特征序列进行至少一次Transformer的全局特征提取,得到一维目标特征序列。本发明能够加强Transformer的特征提取能力。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top