专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果68个,建议您升级VIP下载更多相关专利
  • [发明专利]多类型车牌识别模型的训练方法、装置、设备及存储介质-CN202311201382.X在审
  • 殷绪成;刘琦;陈松路;陈峰 - 珠海亿智电子科技有限公司
  • 2023-09-18 - 2023-10-24 - G06V20/62
  • 本发明适用图像识别技术领域,提供了一种多类型车牌识别模型的训练方法,该方法包括:通过编码器对车牌样本图像进行特征提取,得到车牌样本图像的样本视觉特征,通过解码器对样本视觉特征进行特征提取,得到车牌样本图像中每个样本字符的样本字符特征,根据样本字符特征,通过字符分类器获得到对应样本字符的样本分类概率,基于对比学习损失函数,根据样本字符特征确定对比学习损失值,并基于交叉熵损失函数,根据样本分类概率和预设的样本字符真值确定交叉熵损失值,根据交叉熵损失值和对比学习损失值,对多类型车牌识别模型进行训练,从而通过采用对比学习策略对模型进行训练,降低了模型对形近字错识的概率,提升了模型识别性能和训练效果。
  • 类型车牌识别模型训练方法装置设备存储介质
  • [发明专利]一种基于空间线索的语音-图像跨模态检索方法及装置-CN202311104574.9在审
  • 钱馨园;高天浩;王雨桐;魏丽芳;刘艳;殷绪成 - 北京科技大学
  • 2023-08-30 - 2023-09-29 - G06F16/432
  • 本发明公开了一种基于空间线索的语音‑图像跨模态检索方法及装置,涉及计算机视觉和语音处理技术领域。包括:将语音信号输入到音频编码器,得到空间相关的声学特征;将图像信息输入到图像编码器,得到场景图像特征;对特征进行CSIR,得到跨模态检索结果。本发明通过使用深度学习和相关算法,能够对图像和语音之间的空间关联性进行分析与建模,从而实现图像和语音之间的跨模态检索。与以往的跨模态检索方法只针对语音‑图像的共同语义信息建模不同,本发明重点关注不同模态之间的空间语义一致性,通过深入研究图像和语音之间的空间属性联系,本发明可以帮助用户更高效地检索相关的图像和语音内容,提供更好的交互体验和信息管理能力。
  • 一种基于空间线索语音图像跨模态检索方法装置
  • [发明专利]一种基于Transformer的人脸检测方法及装置-CN202310746034.4在审
  • 邢煜梓;殷绪成;陈磊;李凯;刘琦;陈松路;张梁凤;胡梅钰 - 北京科技大学
  • 2023-06-21 - 2023-09-12 - G06V40/16
  • 本发明公开了一种基于Transformer的人脸检测方法及装置,涉及计算机视觉技术领域。包括:获取待检测的图像数据;将图像数据输入到训练好的基于Transformer的人脸检测模型;其中,基于Transformer的人脸检测模型包括特征提取模块、多尺度特征构造模块、人脸检测模块以及人脸关键点检测模块;根据图像数据以及基于Transformer的人脸检测模型,得到图像数据的人脸检测结果。本发明使用Transformer作为骨干网络,通过双阶段目标检测结构实现基于Transformer的人脸检测。这样既能有效利用Transformer能更好地获得全局信息的特点,又能保证在使用相对较小的数据集时模型能够快速收敛。
  • 一种基于transformer检测方法装置
  • [发明专利]异质人脸识别模型的训练方法、识别方法、装置及设备-CN202310399938.4在审
  • 孟星华;刘艳;杨耀;杨思琪;殷绪成 - 北京科技大学
  • 2023-04-13 - 2023-09-01 - G06V40/16
  • 本发明实施例涉及一种异质人脸识别模型的训练方法、识别方法、装置及设备,涉及图像处理领域,通过将样本集中各类目标对象的至少两种模态人脸图像输入到预训练的识别模型中,输出至少两种模态人脸图像对应的特征向量;根据特征向量确定第一原型向量并初始化分类器参数,获得初始异质人脸识别模型;迭代执行如下步骤,直至获得最终识别模型:将预设数量的跨模态困难样本对输入到上一迭代获得的特征提取器中,输出每个跨模态困难样本对的两个特征向量;根据任一特征向量和第一原型向量确定第二原型向量;根据另一特征向量和第二原型向量构建模型损失函数;调整上一迭代获得模型参数;即在模型训练时,在原型中添加了跨模态信息,提高模型精度。
  • 异质人脸识别模型训练方法装置设备
  • [发明专利]车牌识别方法和装置-CN202310572398.5有效
  • 殷绪成;陈松路;刘琦;陈峰 - 珠海亿智电子科技有限公司
  • 2023-05-22 - 2023-08-22 - G06V20/62
  • 本公开提供一种车牌识别方法和装置,包括:获取待识别车牌的待识别图像,对待识别图像依次进行局部特征提取处理和全局类型感知处理,得到待识别车牌的全局特征,其中,全局特征用于表征待识别图像中任意两个像素点之间的关系,根据全局特征和并行阅读顺序,对待识别图像进行并行字符感知处理,得到待识别车牌的字符增强特征,根据字符增强特征预测得到待识别车牌的车牌信息,以提高车牌识别的效率,且可以提高车牌识别的准确性和可靠性。
  • 车牌识别方法装置
  • [发明专利]一种多模态的表现性语音合成方法及装置-CN202310613237.6有效
  • 刘艳;魏丽芳;钱馨园;张传飞;赖志豪;刘琦;张天昊;陈松路;殷绪成 - 北京科技大学
  • 2023-05-29 - 2023-08-15 - G10L13/02
  • 本发明公开了一种多模态的表现性语音合成方法及装置,属于语音合成技术领域,方法包括:将噪声语谱图和与噪声语谱图对应的第一无声视频序列输入至噪声掩码编码器,通过噪声掩码编码器获得去噪掩码;将第二无声视频序列输入至多尺度风格编码器,通过多尺度风格编码器提供多尺度的风格嵌入;将文本信息输入至文本编码器,通过文本编码器获得文本信息嵌入;文本信息嵌入序列经过变量适配器的处理,获得帧级别的语音特征;将帧级别的语音特征与去噪掩码相乘,获得去噪后的帧级别的语音特征;将去噪后的帧级别的语音特征与风格嵌入在通道维度上进行拼接;将拼接得到的特征序列输入至解码器,通过解码器合成干净的语谱图。
  • 一种多模态表现语音合成方法装置
  • [发明专利]图像超分辨率方法及装置-CN202210800137.X有效
  • 祝晓斌;周鸿杨;殷绪成 - 北京科技大学
  • 2022-07-06 - 2023-06-23 - G06T3/40
  • 本发明涉及一种图像超分辨率方法及装置。所述图像超分辨率方法包括:获取训练数据集,训练数据集中包括多个图像数据对,每个图像数据对包括对应于源域的源图像和对应于目标域的目标图像;使用训练数据集对循环生成对抗网络模型进行训练:循环生成对抗网络模型包括用于将图像从源域转换为目标域的第一域转换模块,用于将图像从目标域转换为源域的第二域转换模块;在训练完成后,将第一待处理图像输入至第一域转换模块,通过第一域转换模块输出第二待处理图像;将第二待处理图像输入至预先训练好的超分辨率模型,通过超分辨率模型输出超分辨率图像。
  • 图像分辨率方法装置

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top