[发明专利]会议发言人的讲话纪要生成方法、装置、设备及介质在审
| 申请号: | 202111059311.1 | 申请日: | 2021-09-09 |
| 公开(公告)号: | CN113779234A | 公开(公告)日: | 2021-12-10 |
| 发明(设计)人: | 张榕佐 | 申请(专利权)人: | 京东方科技集团股份有限公司 |
| 主分类号: | G06F16/34 | 分类号: | G06F16/34;G06F16/44;G06F16/48;G06K9/00;G06N3/08;G10L15/26 |
| 代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 李莎 |
| 地址: | 100015 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 会议 发言人 讲话 纪要 生成 方法 装置 设备 介质 | ||
1.一种会议发言人的讲话纪要生成方法,包括:
获取目标区域内的与时间相关联的声音信息和图像信息;
对所述声音信息进行语音识别以生成对应的文本信息,所述文本信息包括对应于第一时间段的第一文本数据段;
基于所述第一时间段内的所述图像信息进行体态识别,得到所述第一时间段内的听众的体态类型;
基于所述体态类型确定所述第一文本数据段为所述讲话纪要。
2.根据权利要求1所述的方法,其中,根据权利要求1所述的方法,其中,基于所述体态类型确定所述第一文本数据段为所述讲话纪要,包括:
响应于听众的所述体态类型符合预设体态条件,确定所述第一文本数据段为所述讲话纪要;
或,响应于听众的所述体态特征符合预设体态条件,将所述第一文本数据段的评分加上第一分值;基于所述第一文本数据段的评分确定所述第一文本数据段为所述讲话纪要。
3.根据权利要求1所述的方法,还包括:
所述文本信息还包括对应于第二时间段的第二文本数据段,所述第二时间段为早于所述第一时间段的相邻时间段;
基于所述第二时间段内的所述图像信息进行体态识别,得到所述第二时间段内的所述听众的第二体态特征;以及基于所述第一时间段内的所述图像信息进行体态识别,得到所述第一时间段内的所述听众的第一体态特征;
比较所述第二体态特征和所述第一体态特征,得到所述第二时间段到所述第一时间段的所述听众的体态变化;
基于所述体态变化确定所述第一文本数据段为讲话纪要。
4.根据权利要求3所述的方法,基于所述体态变化确定所述第一文本数据段为讲话纪要,包括:
响应于所述体态变化符合预设变化特征,确定所述第一文本数据段为所述讲话纪要;
或,响应于所述体态变化符合预设变化特征,将所述第一文本数据段的评分加上第二分值,所述第二分值大于0;基于所述第一文本数据段的评分确定所述第一文本数据段为所述讲话纪要。
5.根据权利要求4所述的方法,还包括:
基于所述第一时间段内的所述声音信息进行第一预设声音识别,判断所述第一时间段内是否包括第一预设声音;
则响应于所述体态变化符合预设变化特征,确定所述第一文本数据段为所述讲话纪要,进一步包括:
响应于所述体态变化符合预设变化特征且所述第一时间段内不包括所述第一预设声音,确定所述第一文本数据段为讲话纪要。
6.根据权利要求5所述的方法,其中,基于所述第一文本数据段的评分确定所述第一文本数据段为所述讲话纪要,进一步包括:
响应于所述第一时间段内包括所述第一预设声音,将所述第一文本数据段的评分加上第三分值,所述第三分值小于0;其中,所述第一预设声音能够引起所述体态变化;
基于所述第一文本数据段的当前评分确定所述第一文本数据段为所述讲话纪要。
7.根据权利要求4所述的方法,还包括:基于所述第一时间段内的所述声音信息进行噪声识别,得到所述第一时间段内的第一噪声音量;以及基于所述第二时间段内的所述声音信息进行噪声识别,得到所述第二时间段内的第二噪声音量;
比较所述第二噪声音量和所述第一噪声音量,得到所述第二时间段到所述第一时间段的噪声音量变化;
则基于所述第一文本数据段的评分确定所述第一文本数据段为所述讲话纪要,进一步包括:
响应于所述噪声音量变化增加,将所述第一文本数据段的评分加上第四分值;
基于所述第一文本数据段的当前评分确定所述第一文本数据段为所述讲话纪要。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东方科技集团股份有限公司,未经京东方科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111059311.1/1.html,转载请声明来源钻瓜专利网。





