[发明专利]音频的识别文本校正方法、音频识别设备、装置和介质在审

申请号：	202110004366.6	申请日：	2021-01-04
公开（公告）号：	CN112686006A	公开（公告）日：	2021-04-20
发明（设计）人：	郑利群	申请（专利权）人：	深圳前海微众银行股份有限公司
主分类号：	G06F40/166	分类号：	G06F40/166;G06F9/451;G10L15/26
代理公司：	深圳市世纪恒程知识产权代理事务所 44287	代理人：	张志江
地址：	518000 广东省深圳市前海深港合作区前***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	音频识别文本校正方法设备装置介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及金融科技技术领域，公开了一种基于音频的识别文本校正方法、音频识别装置、设备及介质。所述音频的识别文本校正方法包括：获取音频，并将所述音频输入各个所述预设音频识别系统得到每个所述预设音频识别系统输出的第一识别文本；根据各个所述第一识别文本确定所述音频对应的第二识别文本，其中，所述第二识别文本中包括目标文字内容，所述目标文字内容为所述预设音频识别系统对音频片段识别出错所转换的文字内容，所述音频由多个音频片段组成。本发明提高了音频识别文本的校正效率。

技术领域

本发明涉及金融科技(Fintech)技术领域，尤其涉及一种音频的识别文本校正方法、音频识别设备、装置及介质。

背景技术

随着计算机技术的发展，越来越多的技术应用在金融领域，传统金融业正在逐步向金融科技(Fintech)转变，但由于金融行业的安全性、实时性要求，也对技术提出了更高的要求。

随着人们对设备的便捷性要求，越来越多的设备具有音频识别功能。而音频识别功能通过设备内的识别模型实现，识别模型需要大量音频识别文本进行训练。识别模型所需的音频识别文本通过系统识别音频得到识别文本，再由人工倾听音频对识别文本进行校正以保证音频识别文本的准确性。目前，在对音频识别文本进行校正时，需要从头到尾校正音频识别文本中的所有文本内容，音频识别文本的校正效率较低。

发明内容

本发明的主要目的在于提供一种音频的识别文本校正方法、音频识别设备、装置及介质，旨在解决音频识别文本的校正效率较低的问题。

为实现上述目的，本发明提供一种音频的识别文本校正方法，应用于音频识别装置，所述音频识别装置包括多个预设音频识别系统，所述音频的识别文本校正方法包括：

获取音频，并将所述音频输入各个所述预设音频识别系统得到每个所述预设音频识别系统输出的第一识别文本；

根据各个所述第一识别文本确定所述音频对应的第二识别文本，其中，所述第二识别文本中包括目标文字内容，所述目标文字内容为所述预设音频识别系统对音频片段识别出错所转换的文字内容，所述音频由多个音频片段组成；

输出所述第二识别文本，其中，所述目标文字内容突出显示于所述第二识别文本。

在一实施例中，所述根据各个所述第一识别文本确定第二识别文本的步骤之后，还包括：

在各个所述第一识别文本中，获取所述音频中音频片段对应的各个文本内容；

比对各个所述文本内容，以确定所述音频片段的文字识别是否存在识别错误；

在目标识别文本中，将各个存在识别错误的所述音频片段对应的文本内容，标记为目标文字内容，以得到第二识别文本，所述目标识别文本根据各个所述第一识别文本确定。

在一实施例中，所述比对各个所述文本内容，以确定所述音频片段的文字识别是否存在识别错误的步骤包括：

比对各个所述文本内容得到比对结果；