[发明专利]一种视频会议中提炼关键词的方法、装置及存储介质在审
申请号: | 202110848123.0 | 申请日: | 2021-07-27 |
公开(公告)号: | CN113505597A | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 李璐;冯文澜 | 申请(专利权)人: | 随锐科技集团股份有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/216;G06F16/483 |
代理公司: | 北京兴智翔达知识产权代理有限公司 11768 | 代理人: | 郭卫芹 |
地址: | 100192 北京市海淀区宝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频会议 提炼 关键词 方法 装置 存储 介质 | ||
1.一种视频会议中提炼关键词的方法,其特征在于,包括以下步骤:
S1:获取插话者和主持者的语音,识别语音中的文字,并对文字进行分词;
S2:对分词后的文字进行关键词提取;
S3:在插话者和主持者的语音中分别抽取关键词,采用余弦相似度算法,计算关键词的相似度,判断相似度是否小于相似度阈值,如果相似度不小于相似度阈值,则进行步骤S5;如果相似度小于相似度阈值,则终止该步骤;
S4:在插话者和主持者的语音中分别抽取关键词,计算抽取的关键词的语义距离,判断语义距离是否小于语义距离阈值,如果语义距离不小于语义距离阈值,则进行步骤S5,语义距离小于语义距离阈值,则终止该步骤;
其中,步骤S3和S4同步进行;
S5:展示插话者的语音内容。
2.根据权利要求1所述的视频会议中提炼关键词的方法、装置及存储介质,其特征在于,在所述步骤S1中,主持者的语音选取插话者的插话节点前30秒的语音。
3.根据权利要求1所述的视频会议中提炼关键词的方法、装置及存储介质,其特征在于,所述步骤S1还包括:摄像头对会议中的参会人员进行表情识别,判断是否出现表情变化,如果出现,则进行下一步骤S2,否则,则重复步骤S1。
4.根据权利要求1所述的视频会议中提炼关键词的方法、装置及存储介质,其特征在于,所述步骤S2中采用词性标注及TF-IDF权重法相结合来提取关键词。
5.根据权利要求4所述的视频会议中提炼关键词的方法、装置及存储介质,其特征在于,所述步骤S2包括:
S201:通过词性标注去除虚词;
S202:使用TF-IDF权重法来计算关键词的权重;
S203:分别获得插话者和主持者的语音的向量。
6.根据权利要求5所述的视频会议中提炼关键词的方法、装置及存储介质,其特征在于,所述步骤S3包括:在插话者和主持者的语音中分别抽取语音,获得其语音的向量,以计算余弦相似度。
7.根据权利要求6所述的视频会议中提炼关键词的方法、装置及存储介质,其特征在于,所述步骤S3还包括:判断插话者和主持者的语音中的关键词中是否包含同义词或反义词,如果两个语音中包含同义词或反义词,则插话者和主持者的语音中用于生成的词频向量中的相应关键词的词频加1。
8.根据权利要求1所述的视频会议中提炼关键词的方法、装置及存储介质,其特征在于,所述步骤S4包括:对插话者和主持者的语音中的关键词进行词性排列,对词性相同的关键词进行语义距离比对,判断语义距离是否大于阀值;
其中,阀值根据语音中的关键词的数量进行设置。
9.一种视频会议中提炼关键词的装置,与会议终端相连接,其特征在于,包括:存储模块、识别模块和微处理器;
所述存储模块用于存储插话者和主持者的语音;
所述识别模块用于识别插话者的语音,当识别到识别插话者的语音时,发送到所述微处理器进行处理;
所述微处理器用于采用所述权利要求1-8中任一项所述的视频会议中提炼关键词的方法来对插话者和主持者的语音进行处理,并将处理将结果发送给所述会议终端。
10.一种存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现根据权利要求1-8中任一项所述的视频会议中提炼关键词的方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于随锐科技集团股份有限公司,未经随锐科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110848123.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:模型训练方法和装置
- 下一篇:一种石油勘探用的管道清洁装置