[发明专利]一种基于大数据的语音识别系统及方法有效
申请号: | 202110015512.5 | 申请日: | 2021-01-07 |
公开(公告)号: | CN112331191B | 公开(公告)日: | 2021-04-16 |
发明(设计)人: | 时彪 | 申请(专利权)人: | 广州华源网络科技有限公司 |
主分类号: | G10L15/10 | 分类号: | G10L15/10;G10L15/08 |
代理公司: | 广州本诺知识产权代理事务所(普通合伙) 44574 | 代理人: | 陈耿 |
地址: | 510670 广东省广州市广州高新技术产业*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 语音 识别 系统 方法 | ||
本发明公开了一种基于大数据的语音识别系统及方法,所述语音识别系统包括个人语音修正库、辅助修正库设置模块、语音信号采集模块和语音识别结果修正判断模块,所述个人语音修正库用于存储修正字,所述辅助修正库设置模块用于选取个人语音修正库的辅助修正库,所述语音信号采集模块用于采集语音信号,所述语音识别结果修正判断模块通过对语音信号进行识别播报以及与用户之间的交互判断是否要修正语音识别结果。
技术领域
本发明涉及大数据技术领域,具体为一种基于大数据的语音识别系统及方法。
背景技术
随着科技的发展,智能设备逐渐走入人们的生活中。现有的智能设备在用户家中的无线网络连接,智能设备采集到用户的语音信号后,能够根据用户的语音信号执行相应的操作,从而大大丰富了和方便人们的娱乐生活。比如智能音箱,在采集到用户的语音信号后,对语音信号进行识别,从而实现对智能家居设备的控制,比如打开窗帘、设置冰箱温度、提前让热水器升温等。但是,现有技术中,常常发生语音信号识别与用户表达含义不一样的情况。
发明内容
本发明的目的在于提供一种基于大数据的语音识别系统及方法,以解决上述背景技术中提出的问题。
为了解决上述技术问题,本发明提供如下技术方案:一种基于大数据的语音识别系统,所述语音识别系统包括个人语音修正库、辅助修正库设置模块、语音信号采集模块和语音识别结果修正判断模块,所述个人语音修正库用于存储修正字,所述辅助修正库设置模块用于选取个人语音修正库的辅助修正库,所述语音信号采集模块用于采集语音信号,所述语音识别结果修正判断模块通过对语音信号进行识别播报以及与用户之间的交互判断是否要修正语音识别结果。
进一步的,所述辅助修正库设置模块包括重合度计算模块和重合度比较模块,所述重合度计算模块用于计算两两个人语音修正库之间的修正字的重合度,所述重合度比较模块将重合度计算模块计算出的重合度与第一重合度阈值进行比较,在重合度大于等于第一重合度阈值时,设置这两个语音修正库互为彼此的辅助修正库;所述语音识别结果修正判断模块包括语音采集间隔计算比较模块、第一相似度计算模块、语音采集时间判断模块、第二相似度计算模块、相似度比较模块、第一处理模块和第二处理模块;所述语音采集间隔计算比较模块将麦克风采集到第一语音信号的时间为第一时间,将麦克风采集到第二语音信号的时间为第二时间,计算第二时间与第一时间之间的间隔时长,并将间隔时长与第一间隔时长阈值进行比较,在间隔时长小于第一间隔时长阈值时,令第一相似度计算模块计算第一语音信号得到的第一语音识别结果与第二语音信号得到的第二语音识别结果之间的相似度为第一相似度,在第一相似度大于第一相似度阈值时,所述语音采集时间判断模块用于判断麦克风采集到第三语音信号时的时间是否与第二时间的间隔时长之间小于第二间隔时长阈值的时间,在小于第二间隔时长阈值的时间,所述第二相似度计算模块计算第一语音信号得到的第一语音识别结果与第三语音信号得到的第二语音识别结果之间的相似度为第二相似度,所述相似度比较模块用于比较第一相似度和第二相似度的大小,在第一相似度与第二相似度不相等时令第一处理模块对语音识别结果进行处理,在第一相似度与第二相似度相等时令第二处理模块对语音识别结果进行处理。
进一步的,所述第一处理模块包括播报询问模块、答复采集模块和肯定答复处理模块,所述播报询问模块用于播报询问第三语音识别结果识别是否正确,所述答复采集模块用于采集关于答复的语音信号,在采集到肯定答复的语音信号时,智能设备按照第三语音识别结果执行相应的操作并令肯定答复处理模块工作,在采集到否定答复时令第二处理模块工作,所述肯定答复处理模块包括第一关键字拆分模块、拆分关键字比较模块和修正字第一存储模块,所述第一关键字拆分模块将第三语音识别结果拆分成多个第一关键字,所述拆分关键字比较模块将每个第一关键字依次与第二语音识别结果中相应位置的第二关键字进行比较,存在某个第一关键字与第二关键字不相同时,令修正字第一存储模块采集第一关键字与第二关键字互为彼此的修正字,并将其存入第三语音信号所对应的声纹特征的个人语音修正库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州华源网络科技有限公司,未经广州华源网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110015512.5/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置