[发明专利]语音训练数据生成方法、装置、设备及可读存储介质在审

申请号：	201910432661.4	申请日：	2019-05-23
公开（公告）号：	CN110310626A	公开（公告）日：	2019-10-08
发明（设计）人：	彭捷	申请（专利权）人：	平安科技（深圳）有限公司
主分类号：	G10L15/06	分类号：	G10L15/06;G10L25/78
代理公司：	北京市京大律师事务所 11321	代理人：	刘挽澜
地址：	518033 广东省深圳市福田区福***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及数据采集技术领域，公开了一种语音训练数据生成方法、装置、设备及可读存储介质，语音训练数据生成方法包括：获取音频文件以及所述音频文件对应的原文文本；对所述音频文件进行静音点检测，确定所述音频文件的静音点；根据所述静音点，将所述音频文件拆分为若干个音频片段文件；通过通用模型对所述若干个音频片段进行识别，得到每个音频片段对应的识别结果；从所述原文文本中确定所述识别结果对应的文本片段；将所述识别结果对应的音频片段以及文本片段关联为一组语音训练数据，得到若干组语音训练数据。通过本发明，大大提高了生成语音训练数据的效率，且降低了生成成本。
搜索关键词：	语音训练数据音频文件音频片段可读存储介质文本片段原文文本静音点数据采集技术静音点检测通用模型关联
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种语音训练数据生成方法，其特征在于，所述语音训练数据生成方法包括以下步骤：获取音频文件以及所述音频文件对应的原文文本；对所述音频文件进行静音点检测，确定所述音频文件的静音点；根据所述静音点，将所述音频文件拆分为若干个音频片段文件；通过通用模型对所述若干个音频片段进行识别，得到每个音频片段对应的识别结果；从所述原文文本中确定所述识别结果对应的文本片段；将所述识别结果对应的音频片段以及文本片段关联为一组语音训练数据，得到若干组语音训练数据。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于平安科技（深圳）有限公司，未经平安科技（深圳）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910432661.4/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]语音训练数据生成方法、装置、设备及可读存储介质在审

专利文献下载