[发明专利]麦克风控制方法、电子装置及计算机可读存储介质有效
申请号: | 202010235328.7 | 申请日: | 2020-03-30 |
公开(公告)号: | CN111429914B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 邬慷;肖金平;刘屹;万正勇;沈志勇 | 申请(专利权)人: | 招商局金融科技有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L17/00;G10L21/0272 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深圳市福田区华富街*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 麦克风 控制 方法 电子 装置 计算机 可读 存储 介质 | ||
本发明涉及智能控制技术领域,揭露了一种麦克风控制方法,该方法包括:根据预设用户群的字典矩阵对预设用户群的当前语音信息分解,得到所述预设用户群中参与发言的每个发言者的语音信息的时域信号数据,将所述时域信号数据输入预先训练好的声纹识别模型,得到所述每个发言者的语音特征,当判断预设声纹库存储有某一指定发言者的语音特征时,获取所述指定发言者的标签,根据预先确定的麦克风与发言者的标签的映射关系,确定所述指定发言者的麦克风,并开启所述麦克风。本发明还提出一种电子装置以及一种计算机可读存储介质。本发明实现了智能化控制麦克风的开关。
技术领域
本发明涉及智能控制技术领域,尤其涉及一种麦克风控制方法、电子装置及计算机可读存储介质。
背景技术
随着当前社会信息技术的发展,各企业对会议的要求与时俱进,此时智能会议应运而生,智能会议采用ASR(Automatic Speech Recognition,语音识别)技术将发言者的语音实时转换为文字信息,从而自动生成报告字幕、会议记录等,保证了会议的高效进行。
然而,现有技术中,无法实现麦克风开关的智能化控制,当前麦克风开关通常由人工控制,会议过程中存在以下问题:
1、人工频繁切换麦克风会破坏会议进程的连续性,打断与会者的发言思路;
2、人工控制麦克风开关难以保证语音输出的实时性、准确性,易导致语音转写为文字的准确率降低以及转写资源的浪费;
3、与会者发言时如果忘记开启麦克风,将导致会议数据不完整。
因此,为解决上述问题,亟需一种智能化控制麦克风开关的方案。
发明内容
鉴于以上内容,有必要提供一种麦克风控制方法,旨在实现智能化控制麦克风的开关。
本发明提供的麦克风控制方法,包括:
分解步骤:实时获取预设用户群的当前语音信息,根据所述预设用户群的字典矩阵对所述当前语音信息进行分解,得到所述预设用户群中参与发言的每个发言者的语音信息的时域信号数据;
识别步骤:将所述预设用户群中参与发言的每个发言者的语音信息的时域信号数据输入预先训练好的声纹识别模型,得到所述每个发言者的语音特征,判断预设声纹库是否存储有所述每个发言者的语音特征;
开启步骤:当判断所述预设声纹库存储有某一指定发言者的语音特征时,获取所述指定发言者的标签,根据预先确定的麦克风与发言者的标签的映射关系,确定所述指定发言者的麦克风,并开启所述麦克风。
可选的,所述方法在分解步骤前还包括:
构建步骤:收集所述预设用户群中每个用户的语音信息,计算所述预设用户群中每个用户的字典矩阵,并基于所述每个用户的字典矩阵构建所述预设用户群的字典矩阵。
可选的,所述方法在开启步骤后还包括:
关闭步骤:获取从各个已开启的麦克风输入的语音信息,对所述语音信息进行转写并对转写得到的文本信息进行有效性判断,若超过预设时间阈值从某一麦克风输入的语音信息所转写得到的文本信息皆为无效信息,则关闭所述麦克风。
可选的,所述根据所述预设用户群的字典矩阵对所述当前语音信息进行分解包括:
对所述当前语音信息的时域信号数据进行短时傅里叶变换,得到所述当前语音信息的频域信号数据;
对所述当前语音信息的频域信号数据取模数,得到所述当前语音信息的幅度谱;
根据所述预设用户群的字典矩阵对所述当前语音信息的幅度谱进行分解及有效性判断,得到所述预设用户群中参与发言的每个发言者的语音信息的幅度谱;
对所述每个发言者的语音信息的幅度谱进行过滤;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于招商局金融科技有限公司,未经招商局金融科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010235328.7/2.html,转载请声明来源钻瓜专利网。