[发明专利]监室对讲机声纹识别方法、系统及存储器在审
申请号: | 202110594985.5 | 申请日: | 2021-05-28 |
公开(公告)号: | CN113314125A | 公开(公告)日: | 2021-08-27 |
发明(设计)人: | 张维锋;韦壹珍 | 申请(专利权)人: | 深圳市展拓电子技术有限公司 |
主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L15/26;H04N7/18 |
代理公司: | 北京维正专利代理有限公司 11508 | 代理人: | 吴珊 |
地址: | 518000 广东省深圳市宝安区石岩街*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对讲机 声纹 识别 方法 系统 存储器 | ||
1.一种监室对讲机声纹识别方法,其特征在于:包括:
基于获取的触发信息,识别从图像获取终端获取的图像以获得身份信息和活动信息;
基于身份信息和活动信息匹配录入的认证信息,以输出启动声纹识别模块和语音识别模块的通话启动信息;
基于声纹识别模块和语音识别模块,形成具有对讲人员的声纹身份信息和语音识别的对话记录的通话记录;
基于获取的通话结束信息,获取时间信息并上传通话记录数据。
2.根据权利要求1所述的监室对讲机声纹识别方法,其特征在于:所述活动信息获取包括:
识别第一时刻的图像获取终端获取的图像获得基准口型图像;
识别第二时刻的图像获取终端获取的图像获得识别口型图像;
基于比较基准口型图像和识别口型图像的特征点,确认活动信息。
3.根据权利要求1所述的监室对讲机声纹识别方法,其特征在于:所述基于声纹识别模块和语音识别模块,形成具有对讲人员的声纹身份信息和语音识别的对话记录的通话记录数据包括:
基于比对获取的声纹信息和预设声纹数据库内数据获取声纹身份信息;
基于获取的语音信息进行语音识别获得对话信息;
结合所述获取声纹身份信息和语音对话信息生成通话记录。
4.根据权利要求3所述的监室对讲机声纹识别方法,其特征在于:
包括所述基于获取的语音信息进行识别获得语音对话信息;
采集语音数据并进行语音识别,获得语音识别文本以及语音预测准确率;
基于比较语音预测准确率和预设阈值准确率,标记低于预设阈值准确率的语音识别文本为待确认文本。
5.根据权利要求4所述的监室对讲机声纹识别方法,其特征在于:基于比较语音预测准确率和预设阈值准确率,标记低于预设阈值准确率的语音识别文本为待确认文本,之后还包括:
获取待确认文本在语音数据中的起始时间,记录待确认文本在语音数据中的起始时间为核对时间。
6.根据权利要求5所述的监室对讲机声纹识别方法,其特征在于:所述基于获取的通话结束信息,获取时间信息并上传通话记录数据包括:
基于获取的通话结束信息,获取时间信息和通话记录数据;
检测通话记录数据中对应筛选词库内筛选词的数量,并记录在在通话记录中;
上传通话记录数据。
7.一种监室对讲机声纹识别系统,其特征在于:包括:
触发模块,用于基于获取的触发信息,识别从图像获取终端获取的图像以获得身份信息和活动信息;
身份识别模块,用于基于身份信息和活动信息匹配录入的认证信息,以输出启动声纹识别模块和语音识别模块的通话启动信息;
通话记录模块,基于声纹识别模块和语音识别模块,形成具有对讲人员的声纹身份信息和语音识别的对话记录的通话记录;
上传模块,基于获取的通话结束信息,获取时间信息并上传通话记录数据。
8.一种存储器,其特征在于:包括指令,所述指令在计算机上运行时,使得计算机执行权利要求1-6任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市展拓电子技术有限公司,未经深圳市展拓电子技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110594985.5/1.html,转载请声明来源钻瓜专利网。