[发明专利]一种视频会议中提炼关键词的方法、装置及存储介质在审
申请号: | 202110848123.0 | 申请日: | 2021-07-27 |
公开(公告)号: | CN113505597A | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 李璐;冯文澜 | 申请(专利权)人: | 随锐科技集团股份有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/216;G06F16/483 |
代理公司: | 北京兴智翔达知识产权代理有限公司 11768 | 代理人: | 郭卫芹 |
地址: | 100192 北京市海淀区宝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频会议 提炼 关键词 方法 装置 存储 介质 | ||
本发明公开了一种视频会议中提炼关键词的方法、装置及存储介质,属于视频多媒体通信的技术领域,该方法包括:S1:获取插话者和主持者的语音,识别语音中的文字,并对文字进行分词;S2:对分词后的文字进行关键词提取;S3:在插话者和主持者的语音中分别抽取关键词,采用余弦相似度算法,计算关键词的相似度,如果相似度不小于阈值,则进行步骤S5;S4:在插话者和主持者的语音中分别抽取关键词,计算抽取的关键词的语义距离,如果语义距离不小于阈值,则进行步骤S5;其中,步骤S3和S4同步进行;S5:展示插话者的语音内容。本发明能够基于自动分词、关键词提取、语义距离和余弦相似度相结合来规范会议纪律,提炼课堂提问过程。
技术领域
本发明属于视频多媒体通信的技术领域,具体涉及一种视频会议中提炼关键词的方法、装置及存储介质。
背景技术
目前,在视频会议中,由于遇到有分歧争论的此类情况,当会议中出现抢话、同时说话会造成会议混乱,扰乱会议秩序。另一种现象是在老师直播过程中,同学有疑难不理解时,老师完全凭个人意愿点名或在答疑区,逐个看提出的问题,这样在课堂上没有时间听完所有问题后科学合理地对问题做出分类并答疑,这样便造成了此知识点听不懂的同学连带下个知识点不理解,造成整堂课程都落下的情况。
目前在视频会议中,直播课程中主要存在以下问题:
在开会过程中,发言人正在讲解还没等发言人表达完,其它参会人就强行打断插话的情况屡见不鲜,这样不但造成会议混乱,打断参会人思路,甚至严重影响会议效果。
直播过程中,由于是在线上无法关注到同学的疑惑表情,通过摄像头采集,可以解决这一问题,另由于课堂时间有限,老师不能听完或看完所有的疑问后再答疑,以下技术可通过余弦相似度及语义距离来判断问题的相似度和相关度,解决直播课程中遇到的此问题。
有鉴于此,特提出本发明。
发明内容
本发明的目的是提供一种视频会议中提炼关键词的方法、装置及存储介质,其能够基于自动分词、关键词提取、语义距离和余弦相似度相结合来规范会议纪律,提炼课堂提问过程。
为了实现上述目的,本发明提供的一种视频会议中提炼关键词的方法,包括以下步骤:
S1:获取插话者和主持者的语音,识别语音中的文字,并对文字进行分词;
S2:对分词后的文字进行关键词提取;
S3:在插话者和主持者的语音中分别抽取关键词,采用余弦相似度算法,计算关键词的相似度,判断相似度是否小于相似度阈值,如果相似度不小于相似度阈值,则进行步骤S5;如果相似度小于相似度阈值,则终止该步骤;
S4:在插话者和主持者的语音中分别抽取关键词,计算抽取的关键词的语义距离,判断语义距离是否小于语义距离阈值,如果语义距离不小于语义距离阈值,则进行步骤S5,语义距离小于语义距离阈值,则终止该步骤;其中,步骤S3和S4同步进行;
其中,步骤S3和S4同步进行
S5:展示插话者的语音内容。
进一步地,在所述步骤S1中,主持者的语音选取插话者的插话节点前30 秒的语音。
进一步地,所述步骤S1还包括:摄像头对会议中的参会人员进行表情识别,判断是否出现表情变化,如果出现,则进行下一步骤S2,否则,则重复步骤S1。
进一步地,所述步骤S2中采用词性标注及TF-IDF权重法相结合来提取关键词。
进一步地,所述步骤S2包括:
S201:通过词性标注去除虚词;
S202:使用TF-IDF权重法来计算关键词的权重;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于随锐科技集团股份有限公司,未经随锐科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110848123.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:模型训练方法和装置
- 下一篇:一种石油勘探用的管道清洁装置