“殷保才”申请（专利权）人搜索_中国专利权人_发明人_技术持有人_科研专家_钻瓜专利网

钻瓜专利网为您找到相关结果72个，建议您升级VIP下载更多相关专利

[发明专利]文本识别方法及相关装置、设备和存储介质-CN202310692381.3在审
发明人：胡金水;刘辰宇;晏黔东;朱旭阳;吴嘉嘉;殷兵;殷保才;刘聪 -专利权人：科大讯飞股份有限公司
申请日： 2023-06-09 - 公布日： 2023-10-24 - 主分类号： G06V30/19 文献下载
摘要：本申请公开了一种文本识别方法及相关装置、设备和存储介质，其中，文本识别方法包括：提取待识别图像的图像特征；基于图像特征执行如下第一解码操作：基于上一解码时刻的解码信息，从图像特征提取得到当前解码时刻的第一视觉特征；并基于当前解码时刻的第一视觉特征及上一解码时刻的解码信息，得到当前解码时刻的语言特征；及基于第一视觉特征和语言特征进行解码，得到当前解码时刻的解码字符；其中，解码信息包括解码字符、解码状态中至少一者，组合各个解码时刻的解码字符得到第一解码操作的候选识别文本；基于若干种解码操作各自的候选识别文本，得到待识别图像的目标识别文本。上述方案，能够提升文本识别的准确性，特别是在OOV上的准确性。
文本识别方法相关装置设备存储介质

[发明专利]图像处理方法、装置、设备及存储介质-CN202310798362.9在审
发明人：程虎;殷兵;殷保才;林垠;刘文超 -专利权人：科大讯飞股份有限公司
申请日： 2023-06-29 - 公布日： 2023-10-13 - 主分类号： G06V10/75 文献下载
摘要：本申请提供了图像处理方法、装置、设备及存储介质，具体实现方案为：获取第一图像中的各个图形元素的属性信息，所述各个图形元素构成所述第一图像中的第一图形对象，根据所述第一图像中的各个图形元素的属性信息，确定所述第一图形对象的图结构信息，以及，获取第二图像中的第二图形对象的图结构信息；至少根据所述第一图形对象的图结构信息，以及所述第二图形对象的图结构信息，从所述第二图形对象中确定出与所述第一图形对象匹配的图形区域。根据本申请的技术方案，能够有效提升拼图图像匹配的准确性。
图像处理方法装置设备存储介质

[发明专利]文图生成方法、装置、设备及存储介质-CN202310865239.4在审
发明人： 殷保才;何山;殷兵;刘聪 -专利权人：科大讯飞股份有限公司
申请日： 2023-07-13 - 公布日： 2023-10-10 - 主分类号： G06T11/60 文献下载
摘要：本申请公开了一种文图生成方法、装置、设备及存储介质，本申请借助大语言模型的语言能力，令大语言模型执行对原始文本描述内容进行加工处理的任务，该任务为使得大语言模型所得到的编辑后文本描述内容相对于原始文本描述内容的丰富度更高的任务，获取大语言模型输出层所提取的文本表征，该文本表征可以作为大语言模型输出的编辑后文本描述内容对应的特征表示，由于编辑后文本描述内容相对于原始文本描述内容的信息丰富度更高，因此获取的输出层所提取的文本表征相对于传统对原始文本描述内容的编码特征，其特征表达能力更强，将该文本表征送入预配置的文图生成模型，得到模型生成图像，该生成图像与文本内容更加匹配，也即图像效果更佳。
生成方法装置设备存储介质

[发明专利]肺部影像角度矫正方法、装置、电子设备和存储介质-CN202010335343.9有效
发明人：周璟瑜;殷保才;魏岩 -专利权人：讯飞医疗科技股份有限公司
申请日： 2020-04-24 - 公布日： 2023-10-10 - 主分类号： G06T5/00 文献下载
摘要：本发明实施例提供一种肺部影像角度矫正方法、装置、电子设备和存储介质，其中方法包括：确定肺部影像中的肺部区域；提取所述肺部区域的初始外轮廓；基于所述初始外轮廓的左右两侧中任一侧的各个边界点之间的距离，确定所述任一侧的精细外轮廓；基于左右两侧的精细外轮廓，确定所述肺部区域的倾斜角度，并基于所述倾斜角度对所述肺部影像进行角度矫正。本发明实施例提供的肺部影像角度矫正方法、装置、电子设备和存储介质，实现了肺部影像的自动角度矫正，同时，精细外轮廓中筛除了虚警边界点，提高了肺部轮廓的精确性，并提高了角度矫正的准确性。
肺部影像角度矫正方法装置电子设备存储介质

[发明专利]一种情感识别方法、装置、存储介质及设备-CN202310651876.1在审
发明人：殷兵;奚昌凤;殷保才 -专利权人：科大讯飞股份有限公司
申请日： 2023-06-01 - 公布日： 2023-08-18 - 主分类号： G06V40/70 文献下载
摘要：本申请公开了一种情感识别方法、装置、存储介质及设备，该方法包括：首先获取待识别的目标视频，其中，目标视频为缺少目标模态信号的视频，然后提取目标视频中非目标模态信号的信号特征，并对该非目标模态信号的信号特征进行解码，生成目标模态信号；接着，提取目标模态信号的信号特征，并利用该目标模态信号或非目标模态信号，生成目标视频对应的文本特征；进而可以根据目标模态信号的信号特征、非目标模态信号的信号特征以及文本特征，对目标视频中的目标用户进行情感识别，得到目标用户对应的情感识别结果。可见，由于本申请的识别依据更加准确，从而能够进一步提高最终情感识别结果的准确率。
一种情感识别方法装置存储介质设备

[发明专利]知识问答方法、装置、设备及存储介质-CN202310506317.1在审
发明人：刘权;殷兵;殷保才;丁瑞;刘文超;胡国平;刘聪;高建清;魏思;王士进 -专利权人：科大讯飞股份有限公司
申请日： 2023-05-05 - 公布日： 2023-08-08 - 主分类号： G06F16/332 文献下载
摘要：本申请公开了一种知识问答方法、装置、设备及存储介质，方法包括：获取用户输入的图片及与图片相关的问题文本，获取图片的描述信息，并将描述信息作为问答知识提供给大语言模型，使得大语言模型能够理解图片中的图像内容，将其作为知识问答对话的上下文信息，在此基础上，将用户输入的问题文本作为提示指令输入给大语言模型，大语言模型能够基于前述理解的图片中的图像内容，对该问题文本进行理解及回复。本申请支持多模态的问题输入，用户可以基于图片进行知识问答，扩展了知识问答的应用场景。并且，按照本申请的方案可以使得大语言模型能够理解图片的图像内容，基于此能够更加准确的给出问题文本所匹配的答复内容。
知识问答方法装置设备存储介质

[发明专利]知识问答方法、装置、设备及存储介质-CN202310506333.0在审
发明人：殷兵;刘聪;高建清;殷保才;丁瑞;刘文超;胡国平;魏思;王士进;刘权 -专利权人：科大讯飞股份有限公司
申请日： 2023-05-05 - 公布日： 2023-08-08 - 主分类号： G06F16/332 文献下载
摘要：本申请公开了一种知识问答方法、装置、设备及存储介质，方法包括：获取用户输入的图片及与图片相关的问题文本，对识别图片中包含的文本信息，并将文本信息作为问答知识提供给大语言模型，使得大语言模型能够理解图片中包含的文本信息，将其作为知识问答对话的上下文信息，在此基础上，将用户输入的问题文本作为提示指令输入给大语言模型，大语言模型能够基于前述理解的图片中包含的文本信息，对该问题文本进行理解及回复。本申请支持多模态的问题输入，用户可以基于图片进行知识问答，扩展了知识问答的应用场景。并且，按照本申请的方案可以使得大语言模型能够理解图片中包含的文本信息，基于此能够更加准确的给出问题文本所匹配的答复内容。
知识问答方法装置设备存储介质

[发明专利]一种人脸识别方法、系统及装置-CN202310295775.5在审
发明人：吴子扬;奚昌凤;殷保才 -专利权人：科大讯飞股份有限公司
申请日： 2023-03-22 - 公布日： 2023-07-25 - 主分类号： G06V40/16 文献下载
摘要：本申请公开了一种人脸识别方法、系统及装置，该方法包括：基于人脸识别模型进行人脸识别，得到待识别图像对应的人脸图像特征；模型训练过程包括：构建包含多个样本图像的训练样本集，将样本图像输入人脸识别模型，获得对应的初始图像特征；将初始类别特征的初始值处理为简化值，得到简化类别特征，将初始图像特征的初始值处理为简化值，得到简化图像特征；获得简化图像特征和各个简化类别特征之间的第一相似度，基于第一相似度从所有初始类别特征中获得样本图像对应的多个参考类别特征；基于所有样本图像对应的类别标签、初始图像特征和参考类别特征，调整人脸识别模型中的参数。通过上述方式，本申请能够提高人脸识别准确率，并节省计算成本。
一种识别方法系统装置

[发明专利]人体指向确定、屏幕控制方法、装置及相关设备-CN202310180797.7有效
发明人：张杰;殷保才;张圆;李华清 -专利权人：科大讯飞股份有限公司
申请日： 2023-03-01 - 公布日： 2023-07-25 - 主分类号： G06V40/10 文献下载
摘要：本申请公开了一种人体指向确定、屏幕控制方法、装置及相关设备，本申请同时获取对人体拍摄的目标图像以及深度点云数据，提取目标图像的人体掩码特征，以及提取深度点云数据的深度点云特征，基于人体掩码特征对深度点云特征进行处理，得到深度补全特征，基于深度补全特征确定人体指向点信息。本申请在传统的基于人体深度点云数据进行人体指向估计的基础上，额外考虑了对人体拍摄的目标图像，利用该目标图像的人体掩码特征对深度点云特征进行处理，得到的深度补全特征相比于单纯从深度点云数据中提取的深度点云特征，其包含的信息更加丰富，进而可以更加准确的估计人体指向点信息，提升了人体指向点信息的准确性。
人体指向确定屏幕控制方法装置相关设备

[发明专利]目标检测方法、装置、电子设备和存储介质-CN202211567234.5在审
发明人：韦若禹;刘文超;王光新;殷保才;王金钖 -专利权人：科大讯飞股份有限公司
申请日： 2022-12-07 - 公布日： 2023-06-30 - 主分类号： G06V10/74 文献下载
摘要：本发明公开一种目标检测方法、装置、电子设备和存储介质，属于图像处理技术领域，所述目标检测方法包括：获取待检测图像，对所述待检测图像进行目标检测，得到目标检测结果；对所述目标检测结果进行负例过滤，得到目标用户对应的检测结果，所述目标用户对应的图像检索特征库是通过对所述目标用户确定的负例图像进行预处理和特征提取得到的。本发明通过无需单独针对目标用户定制目标检测模型，只需要根据目标用户对应的图像检索特征库对目标检测结果进行负例过滤，即可实现针对目标用户定义的目标检测事件得到检测结果，可提高目标检测的效率并降低实现成本。
目标检测方法装置电子设备存储介质

[发明专利]文本的识别方法、装置、设备及存储介质-CN202310141914.9在审
发明人：晏黔东;刘辰宇;吴嘉嘉;胡金水;殷兵;殷保才;谢名亮 -专利权人：科大讯飞股份有限公司
申请日： 2023-02-13 - 公布日： 2023-06-27 - 主分类号： G06V30/226 文献下载
摘要：本申请提供了文本的识别方法、装置、设备及存储介质，具体实现方案为：获取待识别文本的动态笔迹的点级轨迹信息和笔画级轨迹信息；利用所述点级轨迹信息和所述笔画级轨迹信息确定对应的轨迹点特征；基于所述轨迹点特征得到所述待识别文本的识别结果。根据本申请的技术方案，能够有效提升手写文本识别的准确性。
文本识别方法装置设备存储介质

[发明专利]一种交互方法及相关设备和系统-CN202310284388.1在审
发明人：叶润春;林垠;殷保才;殷兵 -专利权人：科大讯飞股份有限公司
申请日： 2023-03-20 - 公布日： 2023-06-23 - 主分类号： G06F3/01 文献下载
摘要：本发明提供了一种交互方法及相关设备和系统，其中，交互方法包括：获取交互区域的多模态信息，多模态信息包括基于多个终端设备中的部分或全部终端设备获取的相对应的图像信息和语音信息；基于多模态信息中的图像信息确定交互区域中是否存在目标用户；若是，则基于多模态信息中的图像信息确定目标用户是否朝向多个终端设备中的一终端设备；若是，则将目标用户朝向的终端设备确定为交互设备；基于多模态信息中的语音信息，确定交互设备对应的控制指令，并向交互设备发送对应的控制指令。本发明提供的交互方法通过有效利用基于多个终端设备获取的多模态信息，使得语音交互不需要唤醒词，如此，整个交互过程更加自然高效。
一种交互方法相关设备系统

[发明专利]人体指向确定、屏幕控制方法、装置及相关设备-CN202310174852.1有效
发明人：李渊强;殷保才;高建清;李华清;张圆;龙思源;孙境廷 -专利权人：科大讯飞股份有限公司
申请日： 2023-02-28 - 公布日： 2023-05-30 - 主分类号： G06V40/10 文献下载
摘要：本申请公开了一种人体指向确定、屏幕控制方法、装置及相关设备，本申请获取对人体采集的图像数据，该图像数据至少包括深度点云图像，基于图像数据，提取人体姿态特征，基于提取的人体姿态特征确定每一人体关键点的空间坐标及对应的指向角度，人体关键点不小于2个，基于每一人体关键点的空间坐标及对应的指向角度，计算每一人体关键点对应的人体指向点信息，进而结合各个人体关键点对应的人体指向点信息，来得到更加精准的最终人体指向点信息，由于综合考虑了多个不同的人体关键点所对应的人体指向点信息得到最终的人体指向点信息，可以避免单个人体关键点所存在的误差，大大提高最终的人体指向点预测的准确性和稳定性。
人体指向确定屏幕控制方法装置相关设备

[发明专利]人脸跟踪方法、装置、电子设备及存储介质-CN202310074684.9在审
发明人：张亚峰;林垠;李超龙;沙文;殷保才 -专利权人：科大讯飞股份有限公司
申请日： 2023-01-16 - 公布日： 2023-05-02 - 主分类号： G06T7/246 文献下载
摘要：本发明提供一种人脸跟踪方法、装置、电子设备及存储介质，所述方法包括：获取视频帧序列中的当前帧，并判断所述当前帧的类型；若所述当前帧是检测帧，则对所述检测帧进行人脸检测，并根据人脸检测的结果进行不同处理，包括：未检出人脸时根据人脸关键点信息执行相似度计算，以及检出人脸时根据深度信息选择最优人脸；若所述当前帧是跟踪帧，则对所述跟踪帧进行人脸标定，并根据人脸标定的结果对当前帧的人脸关键点信息和上一帧的人脸关键信息的相似度计算；当所述检测帧或所述跟踪帧执行相似度计算的结果满足第一预设要求时，获取跟踪框以执行跟踪操作。由于引入了相似度和人脸区域深度信息，使得本发明即使在复杂的场景下，也能实现正确跟踪。
跟踪方法装置电子设备存储介质

[发明专利]一种三维重建方法、装置、边缘设备和存储介质-CN202211703540.7在审
发明人：宋力争;殷保才;李华清;张圆 -专利权人：科大讯飞股份有限公司
申请日： 2022-12-23 - 公布日： 2023-05-02 - 主分类号： G06T17/00 文献下载
摘要：本申请公开了一种三维重建方法、装置、边缘设备和存储介质，该方法包括：获取可见光相机和深度相机对目标对象同步拍摄到的可见光图像和深度图像；基于可见光图像进行稀疏重建，得到稀疏点云数据；其中，稀疏点云数据包含可见光图像中特征点反投影后的第一三维点；基于深度图像在稀疏点云数据中筛选第一三维点，得到第一目标点云数据；至少基于第一目标点云数据进行稠密重建，得到目标对象的三维模型。通过上述方式，本申请能够提高三维重建的效率和精度。
一种三维重建方法装置边缘设备存储介质

1
2
3
4
5
下一页»
尾页
共 72 条