[发明专利]集外词处理方法、电子设备和存储介质在审
| 申请号: | 202211037265.X | 申请日: | 2022-08-26 |
| 公开(公告)号: | CN115410558A | 公开(公告)日: | 2022-11-29 |
| 发明(设计)人: | 唐健 | 申请(专利权)人: | 思必驰科技股份有限公司 |
| 主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/02 |
| 代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 邓婷婷;黄谦 |
| 地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 集外词 处理 方法 电子设备 存储 介质 | ||
本发明公开一种集外词处理方法,本申请实施例提供了一种集外词处理的方法、装置及设备,方法包括:响应获取的集外词,将获取的集外词建立为第一建模单元序列,将集内词建立为第二建模单元序列,查找与所述第一建模单元序列语音相似度最高的第二建模单元序列,建立所述第一建模单元序列与第二建模单元序列的跳转关系。计算所述第一音素序列与所述集内词音素序列之间的编辑距离,将编辑距离最短的第二音素序列确定为相似度最高的音素序列,从而将集外词映射至集内词上。本申请实施例能够减少重新收集集外词相关的训练语料以及重新训练声学模型耗费的巨大时间成本,提高了集外词在相关场景中的转换率。
技术领域
本发明属于语音识别领域,尤其涉及集外词处理方法的电子设备和存储介质。
背景技术
随着人工智能技术的发展,语音识别技术取得了巨大的进步,并开始进入家电、通信、汽车、医疗等各个领域。目前在语音识别领域里,工业界里还是使用声学模型加语言模型的架构较多,虽然模型都是基于大规模语料训练的,并且大多数语料也已经收录进了语言模型中,但是语言模型不可能穷尽任何语料,因此难免还是会存在没见过实际场景中的语料,存在声学中没有遇见到的建模单元序列,这类不存在于声学建模单元序列的词语称为集外词。对于人名,地名或者公司组织等集外词名词,语言模型很难迅速得到识别,因此模型的鲁棒性很差。由于这一类的词汇在声学语料中是很难完全概括,所以识别率会比较差。
在交叉语种的场合下,例如在国内英文场景中,语音中会经常涉及到国内的很多地名,人名,公司组织名,但是语料里根本没有这类的发音,因此导致这一类的词汇很难识别出来。因此需要一种专门识别地名、人名,公司组织名的特定方法或者装置,来迅速将这类特定集外词转换为集内词,从而达到相关场景中的集外词的识别率。
发明内容
本申请实施例的目的在于提供一种集外词处理方法、装置及设备,以提高相关场景中的集外词的识别率,具体技术方案如下:
第一方面,本发明提供集外词转换成集内词的方法,包括,响应于获取的集外词,建立所述集外词为第一单元序列,其中集内词也会有相应的建模单元序列,建立集内词为第二单元序列,查找与所述第一建模单元序列语音相似度最高的第二建模单元序列,建立所述第一建模单元序列与第二建模单元序列的跳转关系。跳转关系的完成是通过计算所述第一建模单元的音素序列与所述集内词第二建模单元的音素序列之间的编辑距离,将编辑距离最短的第二音素序列确定为相似度最高的音素序列,从而将集外词映射至集内词上。
第二方面,本发明提供一种集外词处理装置,包括:
查找程序模块,配置为响应于获取的集外词,响应于获取的集外词,建立集外词为第一单元序列,建立集内词为第二建模单元序列,查找与所述第一建模单元序列语音相似度最高的第二建模单元序列,建立所述第一建模单元序列与第二建模单元序列的跳转关系。计算所述第一音素序列与所述集内词音素序列之间的编辑距离,将编辑距离最短的第二音素序列确定为相似度最高的音素序列,从而将集外词映射至集内词上。
第三方面,本发明提供一种电子设备,其包括至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器有可被所述处理器至少一个处理器执行的指令,所述指令被至少一个处理器执行,以使所述处理器至少一个处理器能够执行本发明任一施例中的集外词到集内词的映射。
第四方面,一种存储介质,其上存储有计算机程序,其特征在于所述程序被处理器执行本发明的任一施例中的集外词到集内词的映射。
本申请实施例通过将获取的集外词建立为第一建模单元序列,将集内词建立为第二建模单元序列,使用查找与所述第一建模单元序列语音相似度最高的第二建模单元序列,建立所述第一建模单元序列与第二建模单元序列的跳转关系。计算所述第一音素序列与所述集内词音素序列之间的编辑距离,将编辑距离最短的第二音素序列确定为相似度最高的音素序列,从而将集外词映射至集内词上。本申请实施例能够减少重新收集集外词相关的训练语料以及重新训练声学模型耗费的巨大时间成本,提高了集外词在相关场景中的转换率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司,未经思必驰科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211037265.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种离型膜生产用表面处理装置
- 下一篇:一种降低脱硫塔酸雾和粉尘颗粒物的结构





