[发明专利]标点预测方法和装置,预测模型,存储介质和电子设备在审
申请号: | 202110659762.2 | 申请日: | 2021-06-15 |
公开(公告)号: | CN115481618A | 公开(公告)日: | 2022-12-16 |
发明(设计)人: | 陈梦喆 | 申请(专利权)人: | 阿里巴巴新加坡控股有限公司 |
主分类号: | G06F40/221 | 分类号: | G06F40/221;G10L15/26 |
代理公司: | 北京清源汇知识产权代理事务所(特殊普通合伙) 11644 | 代理人: | 冯德魁;张艳梅 |
地址: | 新加坡珊顿道*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标点 预测 方法 装置 模型 存储 介质 电子设备 | ||
本申请公开一种标点预测方法和装置,预测模型,存储介质和电子设备,其中预测方法包括:将无标点文本信息输入到构建的标点预测模型中的第一标点预测子模型中进行第一次标点预测,确定第一预测标点;确定所述第一预测标点是否满足设置的目标预测标点输出要求;若否,则通过所述标点预测模型中与所述第一标点预测子模型连接的第二标点预测子模型,对所述无标点文本信息进行第二次标点预测,确定第二预测标点;将所述第二预测标点确定为所述目标预测标点进行输出,从而保证标点预测无损失的前提下,减少计算量。
技术领域
本申请涉及计算机应用技术领域,具体涉及一种标点预测方法和装置,标点预测模型。本申请同时涉及一种实时语音转写方法,一种语音翻译方法,计算机存储介质和电子设备。
背景技术
自动语音识别技术(Automatic Speech Recognition)是一种将人的语音转换为文本的技术。但是转换后的文本信息是没有标点的文本信息,因此,需要对文本信息进行标点的预测,以保证文本信息上屏后的意思表述的准确性。
发明内容
本申请提供一种标点预测方法,以解决现有技术中通过较为复杂或者标点预测层数较多的模型进行标点预测时,需要承担较高的计算量,而在降低计算量时,导致预测标点准确性降低的问题。
本申请提供一种标点预测方法,包括:
将无标点文本信息输入到构建的标点预测模型中的第一标点预测子模型中进行第一次标点预测,确定第一预测标点;
确定所述第一预测标点是否满足设置的目标预测标点输出要求;
若否,则通过所述标点预测模型中与所述第一标点预测子模型连接的第二标点预测子模型,对所述无标点文本信息进行第二次标点预测,确定第二预测标点;
将所述第二预测标点确定为所述目标预测标点进行输出。
在一些实施例中,所述将无标点文本信息输入到构建的标点预测模型中的第一标点预测子模型中进行第一次标点预测,确定第一预测标点,包括:
确定所述第一次标点预测中预测的标点符号是否为用于表征句尾的标点符号;
若是,则将所述预测的标点符号,确定为所述第一预测标点。
在一些实施例中,所述确定所述第一预测标点是否满足设置的目标预测标点输出要求,包括:
获取所述第一预测标点的预测分值;
确定所述预测分值是否大于或等于预先设置的所述目标预测标点的阈值;
若否,则确定所述第一预测标点不满足所述目标预测标点输出要求。
在一些实施例中,所述获取所述第一预测标点的预测分值,包括:
根据所述第一预测标点遍历开发集,确定所述第一预测标点的所述预测分值。
在一些实施例中,还包括:
当所述第一预测标点满足设置的目标预测标点输出要求时,输出所述第一预测标点。
本申请还提供一种标点预测装置,包括:
第一确定单元,用于将无标点文本信息输入到构建的标点预测模型中的第一标点预测子模型中进行第一次标点预测,确定第一预测标点;
第二确定单元,用于确定所述第一预测标点是否满足设置的目标预测标点输出要求;
第三确定单元,用于当所述第二确定单元确定结果为否时,通过所述标点预测模型中与所述第一标点预测子模型连接的第二标点预测子模型,对所述无标点文本信息进行第二次标点预测,确定第二预测标点;
第四确定单元,用于将所述第二预测标点确定为所述目标预测标点进行输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴新加坡控股有限公司,未经阿里巴巴新加坡控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110659762.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:截骨导板
- 下一篇:一种轨道交通耐高温控制柜