[发明专利]一种会议语音识别方法及系统、存储介质及终端在审

专利信息
申请号: 201811504259.4 申请日: 2018-12-10
公开(公告)号: CN109741754A 公开(公告)日: 2019-05-10
发明(设计)人: 杨进玉;许佑骏;刘旭峰 申请(专利权)人: 上海思创华信信息技术有限公司
主分类号: G10L17/06 分类号: G10L17/06;G10L15/26;G10L21/0272;G10L25/51
代理公司: 上海光华专利事务所(普通合伙) 31219 代理人: 徐秋平
地址: 200336 上海市长宁区*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 会议语音 语音数据 存储介质 声纹特征 终端 会议 匹配 发言时间信息 声纹特征库 多人会议 数据包含 数据分离 文本输出 文本数据 语音识别 构建 判定 查找
【说明书】:

发明提供一种会议语音识别方法及系统、存储介质及终端,包括以下步骤:提取会议参与人的声纹特征,构建会议参与人的声纹特征库;获取会议语音数据,当会议语音数据包含至少两个会议发言人的语音数据时,将会议语音数据分离为与至少两个会议发言人一一对应的发言人语音数据;对于每个发言人语音数据,提取发言人语音数据的声纹特征,查找匹配的声纹特征并判定匹配的声纹特征对应的会议参与人为发言人语音数据对应的会议发言人;对于每个发言人语音数据,文本输出文本数据、会议发言人和发言时间信息。本发明的会议语音识别方法及系统、存储介质及终端。本发明的会议语音识别方法及系统、存储介质及终端提升了多人会议语音识别的实用性。

技术领域

本发明涉及语音识别的技术领域,特别是涉及一种会议语音识别方法及系统、存储介质及终端。

背景技术

与机器进行语音交流,让机器明白你说什么,这是人们长期以来梦寐以求的事情。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。

现有技术中,语音识别的应用场景越来越多,常见的应用系统有:

(1)语音输入系统

相对于键盘输入方法,语音输入更符合人的日常习惯,也更自然、更高效。

(2)语音控制系统

用语音来控制设备的运行,相对于手动控制来说更加快捷、方便,可以用在诸如工业控制、语音拨号系统、智能家电、声控智能玩具等许多领域。

(3)智能对话查询系统

根据客户的语音进行操作,为用户提供自然、友好的数据库检索服务,例如家庭服务、宾馆服务、旅行社服务系统、订票系统、医疗服务、银行服务、股票查询服务等等。

(4)会议记录

在目前智能会议的时代,对于会议中报告及记录的方式,早已摆脱了早期传统的利用专人将会议过程记录于纸张中的人工操作及人工记录时代,而是迈入了利用将会议成员的电脑与投影机连接以播放PPT报告资料,及利用摄影机、麦克风等影音采集设备来直接拍摄、收集会议过程的电子资料的会议时代。然而,现有技术中的智能会议的方式虽可改善早期浪费人力的缺点,但是对于会议开始后的会议记录的整理及备份,说话人的标识、分段、会议纪要的提取等仍需浪费大量人力资源及时间成本。另一方面,保存摄影机及麦克风所采集的资料需要很多电子存储设备进行储存,不便于日后查找、检索与回顾。

随着语音识别技术的飞速发展,语音识别率有很大的提高,并且能够识别的语音内容,经过持续的训练和语料库的不断沉淀也极大的丰富了语音识别的应用场景。智慧会议时代,将会议语音信息转化为文字资料的趋势逐渐成型,一部分公司如讯飞、BAT等已在通用语音识别转换领域有了非常广泛的应用。

然而,通过一个通用的语音识别平台,通过在单人发言时将语音转化为文本来记录会议过程的原始信息已经不是智慧会议的核心任务和功能。智能会议的核心任务和功能是在复杂场景下,当多个人同时参与讨论发言时进行语音识别。然而,多个人同时参与的会议的语音识别存在语音的多模场景,导致多种声纹模型重叠,故存在以下缺陷:

(1)指代词不明确,不知道发言人身份,导致会议记录混乱;

(2)无法还原会议时的场景,会议记录仍然需要大量人力对会议记录进行整理分段。

发明内容

鉴于以上所述现有技术的缺点,本发明的目的在于提供一种会议语音识别方法及系统、存储介质及终端,能够在多人发言讨论时,通过语音分离、发言人标识、发言分段将会议语音转为包含有发言人标识且自动分段的会议记录,从而能够重现会议场景。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海思创华信信息技术有限公司,未经上海思创华信信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811504259.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top