[发明专利]标点预测方法和装置,预测模型,存储介质和电子设备在审
| 申请号: | 202110659762.2 | 申请日: | 2021-06-15 |
| 公开(公告)号: | CN115481618A | 公开(公告)日: | 2022-12-16 |
| 发明(设计)人: | 陈梦喆 | 申请(专利权)人: | 阿里巴巴新加坡控股有限公司 |
| 主分类号: | G06F40/221 | 分类号: | G06F40/221;G10L15/26 |
| 代理公司: | 北京清源汇知识产权代理事务所(特殊普通合伙) 11644 | 代理人: | 冯德魁;张艳梅 |
| 地址: | 新加坡珊顿道*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 标点 预测 方法 装置 模型 存储 介质 电子设备 | ||
1.一种标点预测方法,其特征在于,包括:
将无标点文本信息输入到构建的标点预测模型中的第一标点预测子模型中进行第一次标点预测,确定第一预测标点;
确定所述第一预测标点是否满足设置的目标预测标点输出要求;
若否,则通过所述标点预测模型中与所述第一标点预测子模型连接的第二标点预测子模型,对所述无标点文本信息进行第二次标点预测,确定第二预测标点;
将所述第二预测标点确定为所述目标预测标点进行输出。
2.根据权利要求1所述的标点预测方法,其特征在于,所述将无标点文本信息输入到构建的标点预测模型中的第一标点预测子模型中进行第一次标点预测,确定第一预测标点,包括:
确定所述第一次标点预测中预测的标点符号是否为用于表征句尾的标点符号;
若是,则将所述预测的标点符号,确定为所述第一预测标点。
3.根据权利要求1所述的标点预测方法,其特征在于,所述确定所述第一预测标点是否满足设置的目标预测标点输出要求,包括:
获取所述第一预测标点的预测分值;
确定所述预测分值是否大于或等于预先设置的所述目标预测标点的阈值;
若否,则确定所述第一预测标点不满足所述目标预测标点输出要求。
4.根据权利要求3所述的标点预测方法,其特征在于,所述获取所述第一预测标点的预测分值,包括:
根据所述第一预测标点遍历开发集,确定所述第一预测标点的所述预测分值。
5.根据权利要求1所述的标点预测方法,其特征在于,还包括:
当所述第一预测标点满足设置的目标预测标点输出要求时,输出所述第一预测标点。
6.一种标点预测装置,其特征在于,包括:
第一确定单元,用于将无标点文本信息输入到构建的标点预测模型中的第一标点预测子模型中进行第一次标点预测,确定第一预测标点;
第二确定单元,用于确定所述第一预测标点是否满足设置的目标预测标点输出要求;
第三确定单元,用于当所述第二确定单元确定结果为否时,通过所述标点预测模型中与所述第一标点预测子模型连接的第二标点预测子模型,对所述无标点文本信息进行第二次标点预测,确定第二预测标点;
第四确定单元,用于将所述第二预测标点确定为所述目标预测标点进行输出。
7.一种标点预测模型,其特征在于,包括:第一标点预测子模型和第二标点预测子模型;
所述第一标点预测子模型,位于标点预测模型的输入端,用于对无标点文本信息进行第一次标点预测,确定第一预测标点;包括输出端与连接端,所述输出端用于输出满足目标预测标点输出要求的所述第一预测标点;所述连接端与所述第二标点预测子模型连接;
所述第二标点预测子模型,位于所述标点预测模型的输出端;当所述第一预测标点不满足目标预测标点输出要求时,继续对所述无标点文本信息进行第二次标点预测,将所述第二预测标点确定为所述目标预测标点进行输出。
8.一种语音转写方法,其特征在于,包括:
对接收的语音信息进行语音识别,获取无标点文本信息;
对所述无标点文本信息进行标点预测,获取目标预测标点;
将所述目标预测标点与无标点文本信息合并后的文本信息,确定为目标文本信息进行输出。
9.一种语音翻译方法,其特征在于,包括:
对接收的语音信息按照目标语言进行识别,获取所述目标语言的无标点文本信息;
对所述无标点文本信息进行标点预测,获取目标预测标点;
将所述目标预测标点与所述无标点文本信息合并后的文本信息,确定为与所述语音信息对应的所述目标语言的文本信息进行输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴新加坡控股有限公司,未经阿里巴巴新加坡控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110659762.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:截骨导板
- 下一篇:一种轨道交通耐高温控制柜





