“殷绪成”申请（专利权）人搜索_中国专利权人_发明人_技术持有人_科研专家_钻瓜专利网

钻瓜专利网为您找到相关结果68个，建议您升级VIP下载更多相关专利

[发明专利]多类型车牌识别模型的训练方法、装置、设备及存储介质-CN202311201382.X在审
发明人： 殷绪成;刘琦;陈松路;陈峰 -专利权人：珠海亿智电子科技有限公司
申请日： 2023-09-18 - 公布日： 2023-10-24 - 主分类号： G06V20/62 文献下载
摘要：本发明适用图像识别技术领域，提供了一种多类型车牌识别模型的训练方法，该方法包括：通过编码器对车牌样本图像进行特征提取，得到车牌样本图像的样本视觉特征，通过解码器对样本视觉特征进行特征提取，得到车牌样本图像中每个样本字符的样本字符特征，根据样本字符特征，通过字符分类器获得到对应样本字符的样本分类概率，基于对比学习损失函数，根据样本字符特征确定对比学习损失值，并基于交叉熵损失函数，根据样本分类概率和预设的样本字符真值确定交叉熵损失值，根据交叉熵损失值和对比学习损失值，对多类型车牌识别模型进行训练，从而通过采用对比学习策略对模型进行训练，降低了模型对形近字错识的概率，提升了模型识别性能和训练效果。
类型车牌识别模型训练方法装置设备存储介质

[发明专利]一种铸坯字符的检测与识别方法、装置、设备及存储介质-CN202310593815.4有效
发明人： 殷绪成;胡中杰;陈松路;刘琦;陈峰 -专利权人：珠海亿智电子科技有限公司
申请日： 2023-05-25 - 公布日： 2023-10-17 - 主分类号： G06V30/146 文献下载
摘要：本发明适用人工智能与计算机视觉领域，提供了一种铸坯字符的检测与识别方法、装置、设备及存储介质，该方法包括：当接收到铸坯字符识别请求时，获取待识别的铸坯图像，通过预先训练好的铸坯字符检测识别网络对铸坯图像进行处理，得到铸坯图像的矫正字符信息，其中，铸坯字符检测识别网络包括第一网络和第二网络，根据矫正字符信息和预设的矫正算法得到铸坯图像中的铸坯字符，从而有效降低了漏识和错识的概率，提高了任意方向且多行分布的铸坯字符的检测和识别性能，同时有效提高了识别准确度。
一种字符检测识别方法装置设备存储介质

[发明专利]一种基于空间线索的语音-图像跨模态检索方法及装置-CN202311104574.9在审
发明人：钱馨园;高天浩;王雨桐;魏丽芳;刘艳;殷绪成 -专利权人：北京科技大学
申请日： 2023-08-30 - 公布日： 2023-09-29 - 主分类号： G06F16/432 文献下载
摘要：本发明公开了一种基于空间线索的语音‑图像跨模态检索方法及装置，涉及计算机视觉和语音处理技术领域。包括：将语音信号输入到音频编码器，得到空间相关的声学特征；将图像信息输入到图像编码器，得到场景图像特征；对特征进行CSIR，得到跨模态检索结果。本发明通过使用深度学习和相关算法，能够对图像和语音之间的空间关联性进行分析与建模，从而实现图像和语音之间的跨模态检索。与以往的跨模态检索方法只针对语音‑图像的共同语义信息建模不同，本发明重点关注不同模态之间的空间语义一致性，通过深入研究图像和语音之间的空间属性联系，本发明可以帮助用户更高效地检索相关的图像和语音内容，提供更好的交互体验和信息管理能力。
一种基于空间线索语音图像跨模态检索方法装置

[发明专利]语音识别方法、语音识别模型的训练方法及装置-CN202311088656.9在审
发明人： 殷绪成;赖志豪;张天昊;魏丽芳;陈松路;陈峰 -专利权人：珠海亿智电子科技有限公司
申请日： 2023-08-28 - 公布日： 2023-09-29 - 主分类号： G10L15/16 文献下载
摘要：本公开提供一种语音识别方法、语音识别模型的训练方法及装置，包括：获取待识别语音信号的初始局部语音特征和初始全局语音特征，基于初始全局语音特征，对初始局部语音特征表示待识别语音信号的能力进行增强处理，得到目标局部语音特征，基于初始局部语音特征，对初始全局语音特征表示待识别语音信号的能力进行增强处理，得到目标全局语音特征，根据目标全局语音特征和目标局部语音特征确定待识别语音信号的语音文本，充分考虑了全局语音特征和局部语音特征之间的互补特征，避免了语音信息的丢失，提高了语音识别的准确性和可靠性。
语音识别方法模型训练装置

[发明专利]一种基于堆栈记忆网络的多模态语音合成方法及系统-CN202310814315.9有效
发明人：刘艳;魏丽芳;钱馨园;杨思琪;孙梦磊;刘琦;张天昊;陈松路;殷绪成 -专利权人：北京科技大学
申请日： 2023-07-05 - 公布日： 2023-09-15 - 主分类号： G10L13/08 文献下载
摘要：本发明提供一种基于堆栈记忆网络的多模态语音合成方法及系统，涉及视频和语音处理技术领域，包括：用视频信息辅助从文本中合成具有视听同步性的语音。从人脸中提取说话人特性，即利用人脸控制合成语音的音色。在训练和推理时，通过引入的视频‑语音堆栈记忆网络，显式的利用视频检索对应语音，并从检索得到的语音中提取风格特征，解决多模态TTS模块训练‑推理风格不匹配的问题并增强合成音频的表现性，定制个性化语音。本发明引入视频‑语音堆栈记忆网络显式的连接视频和语音两个模态，而非利用距离损失去最小化不同模态信息提取的特征之间的距离。
一种基于堆栈记忆网络多模态语音合成方法系统

[发明专利]一种基于Transformer的人脸检测方法及装置-CN202310746034.4在审
发明人：邢煜梓;殷绪成;陈磊;李凯;刘琦;陈松路;张梁凤;胡梅钰 -专利权人：北京科技大学
申请日： 2023-06-21 - 公布日： 2023-09-12 - 主分类号： G06V40/16 文献下载
摘要：本发明公开了一种基于Transformer的人脸检测方法及装置，涉及计算机视觉技术领域。包括：获取待检测的图像数据；将图像数据输入到训练好的基于Transformer的人脸检测模型；其中，基于Transformer的人脸检测模型包括特征提取模块、多尺度特征构造模块、人脸检测模块以及人脸关键点检测模块；根据图像数据以及基于Transformer的人脸检测模型，得到图像数据的人脸检测结果。本发明使用Transformer作为骨干网络，通过双阶段目标检测结构实现基于Transformer的人脸检测。这样既能有效利用Transformer能更好地获得全局信息的特点，又能保证在使用相对较小的数据集时模型能够快速收敛。
一种基于 transformer 检测方法装置

[发明专利]异质人脸识别模型的训练方法、识别方法、装置及设备-CN202310399938.4在审
发明人：孟星华;刘艳;杨耀;杨思琪;殷绪成 -专利权人：北京科技大学
申请日： 2023-04-13 - 公布日： 2023-09-01 - 主分类号： G06V40/16 文献下载
摘要：本发明实施例涉及一种异质人脸识别模型的训练方法、识别方法、装置及设备，涉及图像处理领域，通过将样本集中各类目标对象的至少两种模态人脸图像输入到预训练的识别模型中，输出至少两种模态人脸图像对应的特征向量；根据特征向量确定第一原型向量并初始化分类器参数，获得初始异质人脸识别模型；迭代执行如下步骤，直至获得最终识别模型：将预设数量的跨模态困难样本对输入到上一迭代获得的特征提取器中，输出每个跨模态困难样本对的两个特征向量；根据任一特征向量和第一原型向量确定第二原型向量；根据另一特征向量和第二原型向量构建模型损失函数；调整上一迭代获得模型参数；即在模型训练时，在原型中添加了跨模态信息，提高模型精度。
异质人脸识别模型训练方法装置设备

[发明专利]基于全局信息整合的车牌识别方法、装置、设备及介质-CN202310560589.X有效
发明人： 殷绪成;刘元媛;刘琦;陈松路;陈峰 -专利权人：珠海亿智电子科技有限公司
申请日： 2023-05-18 - 公布日： 2023-08-22 - 主分类号： G06V20/62 文献下载
摘要：本发明适用人工智能与计算机视觉领域，提供了一种基于全局信息整合的车牌识别方法、装置、设备及介质，该方法包括：当接收到车牌识别请求时，获取待识别的车牌图像，通过预先训练好的车牌识别模型对车牌图像进行车牌识别，得到该车牌图像中的车牌号，其中，车牌识别模型包括编码器、全局感知模块、可变形空间注意模块以及预测器，从而提高了规则和不规则车牌识别的性能，提升了识别精度和准确率。
基于全局信息整合车牌识别方法装置设备介质

[发明专利]车牌识别方法和装置-CN202310572398.5有效
发明人： 殷绪成;陈松路;刘琦;陈峰 -专利权人：珠海亿智电子科技有限公司
申请日： 2023-05-22 - 公布日： 2023-08-22 - 主分类号： G06V20/62 文献下载
摘要：本公开提供一种车牌识别方法和装置，包括：获取待识别车牌的待识别图像，对待识别图像依次进行局部特征提取处理和全局类型感知处理，得到待识别车牌的全局特征，其中，全局特征用于表征待识别图像中任意两个像素点之间的关系，根据全局特征和并行阅读顺序，对待识别图像进行并行字符感知处理，得到待识别车牌的字符增强特征，根据字符增强特征预测得到待识别车牌的车牌信息，以提高车牌识别的效率，且可以提高车牌识别的准确性和可靠性。
车牌识别方法装置

[发明专利]图像识别方法、装置、计算机设备以及存储介质-CN201911360763.6有效
发明人：杨春;殷绪成;王红法;郭春超 -专利权人：北京科技大学;腾讯科技（深圳）有限公司
申请日： 2019-12-25 - 公布日： 2023-08-22 - 主分类号： G06V20/62 文献下载
摘要：本申请实施例提供了一种图像识别方法、装置、计算机设备以及存储介质，本申请属于人工智能领域，该方法包括：根据分类器集合获取与图像相关联的对象识别结果集合；分类器集合包括至少两个分类器，至少两个分类器为处于不同的参数训练阶段的模型，至少两个分类器均用于识别图像中所包含的目标对象，每个分类器均对应一个识别结果；获取至少两个分类器分别对应的识别置信度；根据识别置信度与对象识别结果集合中所包含的识别结果，确定图像对应的目标识别结果。采用本申请实施例，可以提高图像识别的准确率。
图像识别方法装置计算机设备以及存储介质

[发明专利]基于深度学习的车牌检测方法、装置、设备及存储介质-CN202310614860.3在审
发明人： 殷绪成;代松康;陈松路;刘琦;林金辉;陈峰 -专利权人：珠海亿智电子科技有限公司
申请日： 2023-05-29 - 公布日： 2023-08-15 - 主分类号： G06V20/62 文献下载
摘要：本发明适用人工智能与计算机视觉领域，提供了一种基于深度学习的车牌检测方法、装置、设备及存储介质，该方法包括：当接收到车牌检测请求时，获取待检测的目标图像，通过预先训练好的车牌检测神经网络对目标图像进行车牌检测，得到目标图像中与车辆对应的车牌位置，其中，车牌检测神经网络包括特征提取模块、特征增强模块以及关系匹配模块，从而提高了车牌检测速度和车牌检测的准确率。
基于深度学习车牌检测方法装置设备存储介质

[发明专利]一种多模态的表现性语音合成方法及装置-CN202310613237.6有效
发明人：刘艳;魏丽芳;钱馨园;张传飞;赖志豪;刘琦;张天昊;陈松路;殷绪成 -专利权人：北京科技大学
申请日： 2023-05-29 - 公布日： 2023-08-15 - 主分类号： G10L13/02 文献下载
摘要：本发明公开了一种多模态的表现性语音合成方法及装置，属于语音合成技术领域，方法包括：将噪声语谱图和与噪声语谱图对应的第一无声视频序列输入至噪声掩码编码器，通过噪声掩码编码器获得去噪掩码；将第二无声视频序列输入至多尺度风格编码器，通过多尺度风格编码器提供多尺度的风格嵌入；将文本信息输入至文本编码器，通过文本编码器获得文本信息嵌入；文本信息嵌入序列经过变量适配器的处理，获得帧级别的语音特征；将帧级别的语音特征与去噪掩码相乘，获得去噪后的帧级别的语音特征；将去噪后的帧级别的语音特征与风格嵌入在通道维度上进行拼接；将拼接得到的特征序列输入至解码器，通过解码器合成干净的语谱图。
一种多模态表现语音合成方法装置

[发明专利]图像超分辨率方法、系统、终端设备及存储介质-CN202211056466.4有效
发明人：祝晓斌;周鸿杨;殷绪成 -专利权人：北京科技大学
申请日： 2022-08-31 - 公布日： 2023-08-15 - 主分类号： G06T3/40 文献下载
摘要：本发明涉及图像超分辨率方法、系统、终端设备及存储介质。图像超分辨率方法包括：获取目标处理图像的高频区域的第一隐变量和目标处理图像的低频区域的第二隐变量；根据第一隐变量获得高频区域的第一温度系数，及根据第二隐变量获得低频区域的第二温度系数；根据第一温度系数和第二温度系数对目标处理图像进行设定的超分辨率处理，得到目标获取图像。
图像分辨率方法系统终端设备存储介质

[发明专利]图像超分辨率方法及装置-CN202210800137.X有效
发明人：祝晓斌;周鸿杨;殷绪成 -专利权人：北京科技大学
申请日： 2022-07-06 - 公布日： 2023-06-23 - 主分类号： G06T3/40 文献下载
摘要：本发明涉及一种图像超分辨率方法及装置。所述图像超分辨率方法包括：获取训练数据集，训练数据集中包括多个图像数据对，每个图像数据对包括对应于源域的源图像和对应于目标域的目标图像；使用训练数据集对循环生成对抗网络模型进行训练：循环生成对抗网络模型包括用于将图像从源域转换为目标域的第一域转换模块，用于将图像从目标域转换为源域的第二域转换模块；在训练完成后，将第一待处理图像输入至第一域转换模块，通过第一域转换模块输出第二待处理图像；将第二待处理图像输入至预先训练好的超分辨率模型，通过超分辨率模型输出超分辨率图像。
图像分辨率方法装置

[发明专利]目标检测方法、装置、设备及介质-CN202211529489.2有效
发明人： 殷绪成;张崇建;陈松路;刘琦;黄智勇;陈峰 -专利权人：珠海亿智电子科技有限公司
申请日： 2022-12-01 - 公布日： 2023-04-18 - 主分类号： G06V10/25 文献下载
摘要：本发明适用图像目标检测技术领域，提供了一种目标检测方法、装置、设备及介质，该方法包括：通过第一网络对输入的目标图像进行特征提取，得到对应的第一特征图，根据第一特征图，通过第二网络对该目标图像中的高层特征和低层特征进行特征融合，得到对应的第二特征图，根据第二特征图，通过第三网络对该目标图像中的小目标进行检测，得到对应的小目标检测结果，从而提高小目标的检测速度和检测准确率，进而提高了小目标检测的能力。
目标检测方法装置设备介质

1
2
3
4
5
下一页»
尾页
共 68 条