[发明专利]音频的识别文本校正方法、音频识别设备、装置和介质在审
申请号: | 202110004366.6 | 申请日: | 2021-01-04 |
公开(公告)号: | CN112686006A | 公开(公告)日: | 2021-04-20 |
发明(设计)人: | 郑利群 | 申请(专利权)人: | 深圳前海微众银行股份有限公司 |
主分类号: | G06F40/166 | 分类号: | G06F40/166;G06F9/451;G10L15/26 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 张志江 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 识别 文本 校正 方法 设备 装置 介质 | ||
本发明涉及金融科技技术领域,公开了一种基于音频的识别文本校正方法、音频识别装置、设备及介质。所述音频的识别文本校正方法包括:获取音频,并将所述音频输入各个所述预设音频识别系统得到每个所述预设音频识别系统输出的第一识别文本;根据各个所述第一识别文本确定所述音频对应的第二识别文本,其中,所述第二识别文本中包括目标文字内容,所述目标文字内容为所述预设音频识别系统对音频片段识别出错所转换的文字内容,所述音频由多个音频片段组成。本发明提高了音频识别文本的校正效率。
技术领域
本发明涉及金融科技(Fintech)技术领域,尤其涉及一种音频的识别文本校正方法、音频识别设备、装置及介质。
背景技术
随着计算机技术的发展,越来越多的技术应用在金融领域,传统金融业正在逐步向金融科技(Fintech)转变,但由于金融行业的安全性、实时性要求,也对技术提出了更高的要求。
随着人们对设备的便捷性要求,越来越多的设备具有音频识别功能。而音频识别功能通过设备内的识别模型实现,识别模型需要大量音频识别文本进行训练。识别模型所需的音频识别文本通过系统识别音频得到识别文本,再由人工倾听音频对识别文本进行校正以保证音频识别文本的准确性。目前,在对音频识别文本进行校正时,需要从头到尾校正音频识别文本中的所有文本内容,音频识别文本的校正效率较低。
发明内容
本发明的主要目的在于提供一种音频的识别文本校正方法、音频识别设备、装置及介质,旨在解决音频识别文本的校正效率较低的问题。
为实现上述目的,本发明提供一种音频的识别文本校正方法,应用于音频识别装置,所述音频识别装置包括多个预设音频识别系统,所述音频的识别文本校正方法包括:
获取音频,并将所述音频输入各个所述预设音频识别系统得到每个所述预设音频识别系统输出的第一识别文本;
根据各个所述第一识别文本确定所述音频对应的第二识别文本,其中,所述第二识别文本中包括目标文字内容,所述目标文字内容为所述预设音频识别系统对音频片段识别出错所转换的文字内容,所述音频由多个音频片段组成;
输出所述第二识别文本,其中,所述目标文字内容突出显示于所述第二识别文本。
在一实施例中,所述根据各个所述第一识别文本确定第二识别文本的步骤之后,还包括:
在各个所述第一识别文本中,获取所述音频中音频片段对应的各个文本内容;
比对各个所述文本内容,以确定所述音频片段的文字识别是否存在识别错误;
在目标识别文本中,将各个存在识别错误的所述音频片段对应的文本内容,标记为目标文字内容,以得到第二识别文本,所述目标识别文本根据各个所述第一识别文本确定。
在一实施例中,所述比对各个所述文本内容,以确定所述音频片段的文字识别是否存在识别错误的步骤包括:
比对各个所述文本内容得到比对结果;
根据所述比对结果获取数量,所述数量为不相同的文本内容的数量;
判断所述数量与所述文本内容的总数量之间的比值是否大于预设比值,其中,在所述比值大于预设比值时,判定所述音频片段的文字识别存在识别错误。
在一实施例中,所述在各个所述第一识别文本中,获取所述音频中音频片段对应的各个文本内容的步骤包括:
确定所述音频中音频片段对应的第一音频播放时间;
在每个所述第一识别文本中确定所述第一音频播放时间对应的文本内容,以作为所述音频片段对应的各个文本内容,所述第一识别文本中的每个文本内容关联对应的第一音频播放时间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海微众银行股份有限公司,未经深圳前海微众银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110004366.6/2.html,转载请声明来源钻瓜专利网。