[发明专利]语法纠错的方法和用于语法纠错模型的训练方法及产品在审
| 申请号: | 202110015475.8 | 申请日: | 2021-01-05 |
| 公开(公告)号: | CN112765968A | 公开(公告)日: | 2021-05-07 |
| 发明(设计)人: | 付凯;黄瑾;段亦涛 | 申请(专利权)人: | 网易有道信息技术(北京)有限公司 |
| 主分类号: | G06F40/253 | 分类号: | G06F40/253;G06F40/211 |
| 代理公司: | 北京维昊知识产权代理事务所(普通合伙) 11804 | 代理人: | 陈姗姗;王颖慧 |
| 地址: | 100094 北京市海淀区西北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语法 纠错 方法 用于 模型 训练 产品 | ||
1.一种用机器实现语法纠错的方法,包括:
将输入的第一语种的文本编码成中间表示;
将所述中间表示解码成第二语种的文本;以及
基于所述中间表示和所述第二语种的文本,生成经语法修正的第一语种的修正文本。
2.根据权利要求1所述的方法,其中,基于中间表示和第二语种的文本生成修正文本包括:
针对所述第二语种的文本对应词向量构成的张量,结合输入的第一语种的文本编码生成的中间表示,逐字或者逐词生成所述第一语种的修正文本。
3.根据权利要求1所述的方法,其中,基于中间表示和第二语种的文本生成修正文本包括:
针对所述第二语种的文本对应的隐状态向量组,结合输入的第一语种的文本编码生成的中间表示,逐字或者逐词生成所述第一语种的修正文本。
4.一种用机器实现语法纠错的装置,包括:
第一编码器,其配置用于将输入的第一语种的文本编码成中间表示;
第一解码器,其与所述第一编码器连接,并配置用于将所述中间表示解码成第二语种的文本;以及
第二解码器,其与所述第一编码器和所述第一解码器连接,并配置用于基于所述中间表示和所述第二语种的文本,生成经语法修正的第一语种的修正文本。
5.一种用于语法纠错模型的训练方法,其中所述语法纠错模型包括第一编码器、第一解码器和第二解码器,第一编码器用于将输入的第一语种的文本编码成中间表示,第一解码器用于将所述中间表示解码成第二语种的文本,第二解码器用于基于所述第一编码器和所述第一解码器生成经语法修正的第一语种的修正文本,所述训练方法包括:
利用翻译训练语料对所述语法纠错模型进行第一训练;以及
利用语法修正语料对所述语法纠错模型进行第二训练。
6.根据权利要求5所述的训练方法,其中,利用翻译训练语料进行第一训练包括:
利用从第一语种到第二语种的平行语料对所述第一编码器和所述第一解码器进行第一翻译训练;以及
利用从第二语种到第一语种的平行语料对所述第二解码器进行第二翻译训练。
7.根据权利要求6所述的训练方法,其中,在进行所述第二翻译训练之前,所述训练方法包括:
冻结所述第一编码器和所述第一解码器的参数,以及
移除所述第二解码器与所述第一编码器之间的交互模块。
8.根据权利要求5-7中任一所述的训练方法,其中,利用语法修正语料进行第二训练包括:
基于语法修正语料中的第一语种的错误文本和正确文本的二元文本对,对所述语法纠错模型进行整体训练。
9.根据权利要求8所述的训练方法,其中,在进行所述整体训练之前,所述训练方法包括:
解冻所述第一编码器和所述第一解码器的参数;
添加所述第二解码器与所述第一编码器之间的交互模块;以及
调低所述语法纠错模型的学习率。
10.一种用于语法纠错模型的训练设备,其中所述语法纠错模型包括第一编码器、第一解码器和第二解码器,第一编码器用于将输入的第一语种的文本编码成中间表示,第一解码器用于将所述中间表示解码成第二语种的文本,第二解码器用于基于所述第一编码器和所述第一解码器生成经语法修正的第一语种的修正文本,所述训练设备包括:
第一训练装置,其配置为利用翻译训练语料对所述语法纠错模型进行第一训练;以及
第二训练装置,其配置为利用语法修正语料对所述语法纠错模型进行第二训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易有道信息技术(北京)有限公司,未经网易有道信息技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110015475.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种图像畸变校正处理方法
- 下一篇:一种癌症病理图像自动检测方法及系统





