[发明专利]一种英语口音识别系统有效
申请号: | 201811371012.X | 申请日: | 2018-11-18 |
公开(公告)号: | CN109493846B | 公开(公告)日: | 2021-06-08 |
发明(设计)人: | 钟建生;杨智;高聪;蒋秋燕;李坤 | 申请(专利权)人: | 深圳市声希科技有限公司 |
主分类号: | G10L15/00 | 分类号: | G10L15/00;G10L15/02;G10L15/04;G10L15/06;G10L15/16;G10L15/26 |
代理公司: | 深圳市正德知识产权代理事务所(特殊普通合伙) 44548 | 代理人: | 周善勇 |
地址: | 518000 广东省深圳市宝安区新*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种英语口音识别系统,包括如下步骤,S1:训练多任务多口音模型;S2:识别模块对音频做口音识别;步骤S1完成对口音模型数据库的建立、模型目标函数的建立,以及函数数据的后续处理;步骤S2完成对数据语音信息的处理,先完成单个文本单词的处理,提取单词的美式音素序列和英式音素序列,然后针对整段文本音频进行处理,获取音频特征,最后根据S1中的多任务多口音模型获得音素的后验概率,求出每个单词发音的概率,最后将概率转化,进一步求出整个文本英式/美式发音的概率;本发明能够完成英文文本阅读语音的英式、美式发音的检测,并通过概率的方式呈现出来,便于用户了解,进一步的改进。 | ||
搜索关键词: | 一种 英语 口音 识别 系统 | ||
【主权项】:
1.一种英语口音识别系统,其特征在于,包括如下步骤,S1:训练多任务多口音模型;S2:识别模块对音频做口音识别;步骤S1中还包括如下步骤,S11:建立英式、美式口音的数据库,并对数据进行音素级别的标注;S12:构建多任务多口音的声学模型;S13:设置目标函数,并对函数进行相关处理;S14:函数优化;步骤S2中包括如下步骤,S21:根据用户输入的语音信息,将用户输入的文本分割成单词序列,提取每个单词的英式、美式音素序列;S22:对整个文本音频,获取音频特征;S23:求出步骤S21中每个单词英式音素的后验概率和美式音素的后验概率,并求出每个单词英式/美式发音的概率;S24:归一化处理,转化每个单词英式/美式发音的概率,并获取整个文本英式/美式发音的概率。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市声希科技有限公司,未经深圳市声希科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811371012.X/,转载请声明来源钻瓜专利网。
- 上一篇:用于生成音频的方法及装置
- 下一篇:声音识别系统以及声音识别装置