[发明专利]数据处理方法、装置、可读介质以及电子设备在审

申请号：	202210295585.9	申请日：	2022-03-23
公开（公告）号：	CN114640826A	公开（公告）日：	2022-06-17
发明（设计）人：	李入云;刘艺;蔡猛;马泽君	申请（专利权）人：	北京有竹居网络技术有限公司
主分类号：	H04N7/18	分类号：	H04N7/18;H04N5/76;G10L19/00;G10L15/26;G06V20/40;G06V40/16
代理公司：	北京英创嘉友知识产权代理事务所(普通合伙) 11447	代理人：	温易娜
地址：	101299 北京市平***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	数据处理方法装置可读介质以及电子设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开涉及一种数据处理方法、装置、可读介质以及电子设备，所述方法包括：获取视频数据和音频数据；确定所述视频数据中包括同一人脸的目标视频数据；针对每一人脸的所述目标视频数据，在所述音频数据中确定与该目标视频数据匹配的目标音频数据；基于每一匹配的所述目标音频数据和所述目标视频数据，从各候选发言人中确定所述目标音频数据的目标发言人。本公开的数据处理方法可以提高为目标音频数据确定的目标发言人的准确度。

技术领域

本公开涉及计算机技术领域，具体地，涉及一种数据处理方法、装置、可读介质以及电子设备。

背景技术

办公场景中，常常需要使用会议纪要对会议进行记录和保存，对于一份可读性强的会议纪要，需要记录会议发言人的身份、发言时间以及发言内容。相关技术中，使用说话人分割聚类和语音识别的技术，对会议视频进行处理生成会议纪要，然而，目前的说话人分割聚类技术难以检测会议中的说话人数量，并且难以判断说话人转换点，使得最终生成的会议纪要不准确，效果不理想。

发明内容

提供该部分内容以便以简要的形式介绍构思，这些构思将在后面的具体实施方式部分被详细描述。该部分内容并不旨在标识要求保护的技术方案的关键特征或必要特征，也不旨在用于限制所要求的保护的技术方案的范围。

第一方面，本公开提供一种数据处理方法，包括：

获取视频数据和音频数据；

确定所述视频数据中包括同一人脸的目标视频数据；

针对每一人脸的所述目标视频数据，在所述音频数据中确定与该目标视频数据匹配的目标音频数据；

基于每一匹配的所述目标音频数据和所述目标视频数据，从各候选发言人中确定所述目标音频数据的目标发言人。

第二方面，本公开提供一种数据处理装置，包括：

获取模块，被配置为获取视频数据和音频数据；

第一确定模块，被配置为确定所述视频数据中包括同一人脸的目标视频数据；

第二确定模块，被配置为针对每一人脸的所述目标视频数据，在所述音频数据中确定与该目标视频数据匹配的目标音频数据；

第三确定模块，被配置为基于每一匹配的所述目标音频数据和所述目标视频数据，从各候选发言人中确定所述目标音频数据的目标发言人。