[发明专利]重音检测方法及装置、非瞬时性存储介质有效
申请号: | 202010389701.4 | 申请日: | 2020-05-11 |
公开(公告)号: | CN111292763B | 公开(公告)日: | 2020-08-18 |
发明(设计)人: | 高兴龙;李悦;瞿炜 | 申请(专利权)人: | 新东方教育科技集团有限公司 |
主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L25/27;G10L25/78;G10L25/93 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 彭久云 |
地址: | 100080 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 重音 检测 方法 装置 瞬时 存储 介质 | ||
一种重音检测方法、重音检测装置以及非瞬时性存储介质。该重音检测方法包括:获取单词的音频数据;提取音频数据的韵律特征,以得到韵律特征向量;基于音频数据生成语谱图,以得到语谱特征矩阵;对韵律特征向量和语谱特征矩阵进行拼接操作,以得到第一特征矩阵,并对第一特征矩阵进行去冗余操作,以得到第二特征矩阵;以及通过分类器对第二特征矩阵进行处理,以得到音频数据的重音检测结果。该重音检测方法通过结合韵律特征和语谱特征进行重音检测,可以提升重音检测结果的准确性;同时,去冗余操作可以提升该重音检测方法的重音检测速度和效率。
技术领域
本公开的实施例涉及一种重音检测方法、重音检测装置以及非瞬时性存储介质。
背景技术
在英语口语学习中,每个音节发音的准确性将直接影响说话人的英语表达的标准性,其中,掌握英语重音发音的准确性是非常重要的一个环节。判断一个单词的发音是否准确无误,不仅取决于音节的发音,也取决于重音位置。重音位置的准确与否会影响单词的词义和词性,故重音检测也应作为评价单词发音质量的指标之一。综上所述,单词重音检测是口语评测工作中不可或缺的一环。重音检测的反馈有利于指导英语学习者提高口语能力,帮助英语学习者学习到正确的英语发音。
发明内容
本公开至少一个实施例提供一种重音检测方法,包括:获取单词的音频数据;提取所述音频数据的韵律特征,以得到韵律特征向量;基于所述音频数据生成语谱图,以得到语谱特征矩阵;对所述韵律特征向量和所述语谱特征矩阵进行拼接操作,以得到第一特征矩阵,并对所述第一特征矩阵进行去冗余操作,以得到第二特征矩阵;以及通过分类器对所述第二特征矩阵进行分类处理,以得到所述音频数据的重音检测结果。
例如,在本公开一些实施例提供的重音检测方法中,对所述韵律特征向量和所述语谱特征矩阵进行所述拼接操作,以得到所述第一特征矩阵,包括:分别对所述韵律特征向量和所述语谱特征矩阵进行均值方差归一化处理,以分别得到均值方差归一化的韵律特征向量和均值方差归一化的语谱特征矩阵;以及对所述均值方差归一化的韵律特征向量和所述均值方差归一化的语谱特征矩阵进行拼接操作,以得到所述第一特征矩阵。
例如,在本公开一些实施例提供的重音检测方法中,所述均值方差归一化的语谱特征矩阵包括多个频率特征向量,对所述均值方差归一化的韵律特征向量和所述均值方差归一化的语谱特征矩阵进行拼接操作,以得到所述第一特征矩阵,包括:对所述均值方差归一化的韵律特征向量进行维度变换操作,以得到第一特征向量,其中,所述第一特征向量的维度与所述均值方差归一化的语谱特征矩阵中的任一频率特征向量的维度相同;以及将所述第一特征向量与所述均值方差归一化的语谱特征矩阵进行拼接,以得到所述第一特征矩阵,其中,所述第一特征矩阵包括所述第一特征向量和所述均值方差归一化的语谱特征矩阵中的全部频率特征向量。
例如,在本公开一些实施例提供的重音检测方法中,对所述第一特征矩阵进行所述去冗余操作,以得到所述第二特征矩阵,包括:计算所述第一特征矩阵中的所述第一特征向量与所述第一特征矩阵中的各个频率特征向量的各个余弦相似度;以及响应于所述各个余弦相似度中的任一余弦相似度大于第一预设值,将所述任一余弦相似度对应的所述第一特征矩阵中的频率特征向量设置为全零向量或者将所述任一余弦相似度对应的所述第一特征矩阵中的频率特征向量从所述第一特征矩阵中删除,以得到所述第二特征矩阵。
例如,在本公开一些实施例提供的重音检测方法中,对所述均值方差归一化的韵律特征向量和所述均值方差归一化的语谱特征矩阵进行所述拼接操作,以得到所述第一特征矩阵,包括:将所述均值方差归一化的韵律特征向量分别与所述均值方差归一化的语谱特征矩阵中的每个频率特征向量进行拼接,以得到所述第一特征矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新东方教育科技集团有限公司,未经新东方教育科技集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010389701.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于Bert的语言模型的训练方法及装置
- 下一篇:一种清理机和生产线