[发明专利]一种基于语音识别和自然语言处理的实验室语音监控系统在审

申请号：	202210208601.6	申请日：	2022-03-04
公开（公告）号：	CN114927124A	公开（公告）日：	2022-08-19
发明（设计）人：	叶舒;张峰	申请（专利权）人：	上海交通大学
主分类号：	G10L15/02	分类号：	G10L15/02;G10L15/16;G10L15/26;G10L15/30;G10L17/02;G10L17/18;G10L17/20;G10L21/028;G10L25/24;G10L25/30
代理公司：	上海科盛知识产权代理有限公司 31225	代理人：	陈源源
地址：	200240 ***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于语音识别自然语言处理实验室监控系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于语音识别和自然语言处理的实验室语音监控系统，其特征在于，包括语音采集模块、通信模块和服务端管理模块，所述语音采集模块通过通信模块与服务端管理模块连接：

所述语音采集模块用于采集实验室中的音频信息，并基于辅函数优化分离出语音信息；

所述通信模块用于将语音信息传输至服务端管理模块；

所述服务端管理模块用于根据空间聚类算法将语音信息分离为多个单人语音信息，并根据说话人聚类分割算法在时间维度对每个单人语音信息进行标注，对标注后的语音信息提取特征后，将特征结合风险信息库获取语音信息对应的风险等级，并将风险等级、语音信息和标注信息输出。

2.根据权利要求1所述的一种基于语音识别和自然语言处理的实验室语音监控系统，其特征在于，所述语音采集模块包括麦克风阵列子模块和分离子模块：

所述麦克风阵列子模块包括多个设置在实验室中的全向麦克风，用于采集包含空间位置信息的音频信息；

所述分离子模块根据基于辅函数优化的独立向量分析算法，结合音频信息的空间位置信息将音频信息分离为语音信息和噪声信息。

3.根据权利要求1所述的一种基于语音识别和自然语言处理的实验室语音监控系统，其特征在于，所述服务端管理模块包括信号接收队列子模块、多人语音识别子模块、自然语言处理子模块和查询分析子模块：

所述信号接收队列子模块用于接收语音信息，并传输至多人语音识别子模块；

所述多人语音识别子模块包括预处理器和语音识别器，所述预处理器用于对语音信息进行信号增强，所述语音识别器用于利用深度学习结合基于高斯混合模型的空间聚类算法对信号增强后语音信息进行分离，得到多个单人语音信息；经过说话人分割对语音信息的信号转折点进行切割，最后通过说话人聚类对切割后的语音信息进行标注；

所述自然语言处理子模块采用声学模型将经过多人语音识别子模块的语音信息转化为文本信息，并采用BERT模型提取文本信息的特征，将特征与当前实验室对应的风险信息库进行匹配，得到风险等级；

所述查询分析子模块将语音信息、标注信息和风险等级进行输出。

4.根据权利要求3所述的一种基于语音识别和自然语言处理的实验室语音监控系统，其特征在于，所述预处理器采用基于长短时记忆模型的多目标学习算法，根据对数功率谱特征和理想比率掩码进行算法目标优化，对语音信息进行信号增强。

5.根据权利要求3所述的一种基于语音识别和自然语言处理的实验室语音监控系统，其特征在于，所述声学模型提取语音信息的梅尔倒谱特征，并将特征解码后进行文字输出。

6.根据权利要求3所述的一种基于语音识别和自然语言处理的实验室语音监控系统，其特征在于，所述语音识别器在对语音信号分离前先基于广义加权预测误差算法消除语音信息的混响。

7.根据权利要求3所述的一种基于语音识别和自然语言处理的实验室语音监控系统，其特征在于，所述语音识别器在对语音信号分离前执行以下步骤：

S1、采取基于IVA的盲分离算法，取相互独立的多个语音信息，通过反投影算法将幅值恢复到原始观测信号的范围；

S2、使用最小值控制的递归平均算法的噪声估计算法在每个单独的语音信息上估计平稳噪声；

S3、结合其他语音信息的平稳噪声信息来估计当前语音信息的非平稳噪声；

S4、使用决策导向算法计算先验和后验信噪比，进行多信号滤波处理；

S5、将处理后的所有语音信息通过线性叠加的方式进行合成。

8.根据权利要求3所述的一种基于语音识别和自然语言处理的实验室语音监控系统，其特征在于，当说话人聚类的总聚类数达到默认最大说话人数量，或聚类值超过设定阈值时，停止说话人聚类，输出聚类结果为标注信息。

9.根据权利要求1所述的一种基于语音识别和自然语言处理的实验室语音监控系统，其特征在于，所述服务端管理模块还包括报警子模块，获取风险等级后，判断风险等级是否超过阈值，若是，则对管理员进行告警。

10.根据权利要求1所述的一种基于语音识别和自然语言处理的实验室语音监控系统，其特征在于，所述通信模块采用RS485接口组成的半双工网络。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于上海交通大学，未经上海交通大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202210208601.6/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载