[发明专利]一种获取语音识别模型训练数据的方法及装置在审
申请号: | 202011576869.2 | 申请日: | 2020-12-28 |
公开(公告)号: | CN112802469A | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | 张彬彬;杨超;陈晓宇;曾晨晨 | 申请(专利权)人: | 出门问问(武汉)信息科技有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/06;H04N5/278 |
代理公司: | 北京乐知新创知识产权代理事务所(普通合伙) 11734 | 代理人: | 刘婧 |
地址: | 430223 湖北省武汉市东湖新技术*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种获取语音识别模型训练数据的方法及装置,该方法包括:获取视频流中的第t帧图像;当第t帧图像包括第一字幕区域,获取视频流中的第t+1帧图像,并从第t+1帧图像中确定与第一字幕区域的位置坐标相同的区域作为第二字幕区域;当第二字幕区域与第一字幕区域的相似度大于或等于预设阈值,以步长为1,依次获取视频流中的第t+2、第t+3…第t+n帧图像,直到第t+n帧图像对应的第n+1字幕区域与第t+n‑1帧图像对应的第n字幕区域的相似度小于预设阈值,并计算第t帧图像至第t+n‑1帧图像之间的时间段;提取视频流中时间段的语音,得到语音数据;对第一字幕区域至第n字幕区域中的任意一个字幕区域进行文本识别,得到与语音数据对应的标注文本数据。 | ||
搜索关键词: | 一种 获取 语音 识别 模型 训练 数据 方法 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于出门问问(武汉)信息科技有限公司,未经出门问问(武汉)信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011576869.2/,转载请声明来源钻瓜专利网。
- 上一篇:一种实现组合式量子霍尔电阻样品的基座
- 下一篇:一种家用罐头储存检测设备