[发明专利]融合发音特征的越南语语音识别文本纠错方法及系统有效
申请号: | 202311040757.9 | 申请日: | 2023-08-18 |
公开(公告)号: | CN116757184B | 公开(公告)日: | 2023-10-20 |
发明(设计)人: | 余正涛;杨尚龙;王文君;董凌;孙童 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06F40/232 | 分类号: | G06F40/232;G06N3/0455;G06F18/25;G10L15/00;G10L15/02;G10L15/18;G10L15/16;G10L15/26 |
代理公司: | 昆明隆合知识产权代理事务所(普通合伙) 53220 | 代理人: | 何娇 |
地址: | 650500 云南*** | 国省代码: | 云南;53 |
权利要求书: | 暂无信息 | 说明书: | 暂无信息 |
摘要: | 本发明涉及融合发音特征的越南语语音识别文本纠错方法及系统,属于自然语言处理技术领域。本发明利用国际音标(IPA)对越南语发音进行表征的方法,并在模型编码阶段通过交叉注意力机制融合对应文本序列的发音特征。由于越南语一个发音对应多种语义的特点,将发音特征融入模型中扩大了搜索空间,提高了模型的错误检测和生成能力。此外,本发明使用基于非自回归结构的解码器,可以并行地生成目标序列中的所有单词,从而极大地降低解码时延。实验结果表明,在同等数据集上,该方法相比通用文本纠错模型实现约1%的词错率降低,同时节省近50%的解码时间消耗。 | ||
搜索关键词: | 融合 发音 特征 越南语 语音 识别 文本 纠错 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202311040757.9/,转载请声明来源钻瓜专利网。