[发明专利]一种语音文本的纠错方法及装置有效
申请号: | 201610180122.2 | 申请日: | 2016-03-25 |
公开(公告)号: | CN105869642B | 公开(公告)日: | 2019-09-20 |
发明(设计)人: | 王峰;任晓楠;陈仲帅 | 申请(专利权)人: | 海信集团有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/065 |
代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
地址: | 266100 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明的实施例提供了一种语音文本的纠错方法及装置,涉及数据处理领域,解决了现有技术中语音识别系统识别出的语音文本不准确的问题。该方法包括:提取待识别语音文本以及对应的相关语音识别文本,相关语音识别文本为与待识别语音文本存在语境关联的语音识别文本;获取相关语音识别文本的第一概念关联集以及待识别语音文本的第二概念关联集,概念关联集中包含与语音识别文本中的词语存在关联关系的关联词;根据第一概念关联集确定待识别语音文本中的待纠错词;从第二概念关联集和/或第一概念关联集中获取待纠错词对应的纠错候选词,并用纠错候选词替换待识别语音文本中的待纠错词。本发明应用于语音文本的纠错。 | ||
搜索关键词: | 一种 语音 文本 纠错 方法 装置 | ||
【主权项】:
1.一种语音文本的纠错方法,其特征在于,包括:提取待识别语音文本以及对应的相关语音识别文本,所述相关语音识别文本为与所述待识别语音文本存在语境关联的语音识别文本;获取所述相关语音识别文本的第一概念关联集以及所述待识别语音文本的第二概念关联集,概念关联集中包含与语音识别文本中的词语存在关联关系的关联词;根据所述第一概念关联集,确定所述待识别语音文本中的第一待纠错词;若判定所述第一待纠错词在所述待识别语音文本中的后邻接词为所述待识别语音文本的第二待纠错词时,则将所述第一待纠错词与所述第二待纠错词连接组成第三待纠错词;对所述第三待纠错词分词,得到所述第三待纠错词对应的词语;从所述第二概念关联集和/或所述第一概念关联集中,获取对所述第三待纠错词中每个词语的纠错候选词,用所述纠错候选词替换所述待识别语音文本中的待纠错词。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海信集团有限公司,未经海信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610180122.2/,转载请声明来源钻瓜专利网。