[发明专利]基于端到端的深度学习解码方法、装置、设备及产品在审
申请号: | 202211670698.9 | 申请日: | 2022-12-26 |
公开(公告)号: | CN115859915A | 公开(公告)日: | 2023-03-28 |
发明(设计)人: | 邬青;张军 | 申请(专利权)人: | 上海德衡数据科技有限公司 |
主分类号: | G06F40/126 | 分类号: | G06F40/126;G06F40/56;G06F40/58;G06N3/04 |
代理公司: | 北京恒和顿知识产权代理有限公司 11014 | 代理人: | 林涛 |
地址: | 201600 上海市松江区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 端到端 深度 学习 解码 方法 装置 设备 产品 | ||
本发明提供一种基于端到端的深度学习解码方法、装置、设备及产品,所述方法包括:获取编码语句,并提取所述编码语句的编码数据特征;基于神经网络模型映射所述编码数据特征至解码容器;所述解码容器输出与所述编码语句对应的目标语句。本发明通过在使用神经网络直接将编码语句映射至解码容器,进而生成自然语言,实现了从数据中进行自然语句的解码,提高了机器翻译的效率。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于端到端的深度学习解码方法、装置、设备及产品。
背景技术
目前,用于SMT的组件深度学习的研究非常活跃。对数线性模型促进了基于深度学习的翻译特征的整合。各神经网络结构被设计出来以改进不同的子模块,使SMT的整体性能得到显著提高。例如,Devlin等人提出的联合神经模型在从阿拉伯语到英语的翻译中取得了至少6个BLEU值的惊人提升。然而,尽管人们使用深度学习来改进关键组件但SMT仍然在文本数据中使用了无法处理非线性数据的线性模型。由于新引人的神经特征具有全局依赖性,致使SMT无法设计出高效的动态编程训练和解码算法。因此,非常有必要去探索利用深度学习来提高机器翻译的新途径。
发明内容
本发明提供一种基于端到端的深度学习解码方法、装置、设备及产品,用以解决现有技术无法处理非线性数据的线性模型的缺陷。
根据本发明第一方面提供的一种基于端到端的深度学习解码方法,包括:
获取编码语句,并提取所述编码语句的编码数据特征;
基于神经网络模型映射所述编码数据特征至解码容器;
所述解码容器输出与所述编码语句对应的目标语句。
根据本发明的一种实施方式,所述基于神经网络模型映射所述编码数据特征至解码容器的步骤中,具体包括:
获取所述编码数据特征中的第一数据向量和第二数据向量,其中,所述第一数据向量指向所述编码语句的起始位置,所述第二数据向量指向所述编码语句的终止为止;
根据所述第一数据向量生成第一数据映射向量;
根据所述第二数据向量生成第二数据映射向量;
根据所述第一数据映射向量和所述第二数据映射向量构建所述解码容器。
根据本发明的一种实施方式,所述基于神经网络模型映射所述编码数据特征至解码容器的步骤中,具体包括:
提取所述编码数据特征中的第一编码用语和第二编码用语,所述第一编码用语指向非格式用语,所述第二编码用语指向格式用语;
所述第一编码用语和所述第二编码用语基于神经网络模型映射至解码容器中;
其中,所述第一编码用语和所述第二编码用语包含在解码语句中的位置信息。
根据本发明的一种实施方式,所述基于神经网络模型映射所述编码数据特征至解码容器的步骤中,具体还包括:
提取所述编码数据特征中的第一标点特征和第二标点特征,所述第一标点特征连接相邻两个所述第一编码用语,所述第二标点特征与所述第二编码用语对应;
所述第一标点特征和所述第二标点特征基于神经网络模型映射至解码容器中。
根据本发明的一种实施方式,所述基于神经网络模型映射所述编码数据特征至解码容器的步骤中,具体还包括:
提取所述编码数据特征中的全部编码单词特征,并根据所述编码单词特征进行判断;
确定全部所述编码单词特征之间的重复个数为零,则将每个所述编码单词特征映射至解码容器;
确定全部所述编码单词特征中至少包括两个相同的单词,则将具有相同单词的所述编码单词特征作为重复编码单词特征,并将所述重复编码单词特征映射至编码容器。
根据本发明的一种实施方式,所述解码容器输出与所述编码语句对应的目标语句的步骤中,具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海德衡数据科技有限公司,未经上海德衡数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211670698.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于孪生链的区块链数据跨链交互方法
- 下一篇:一种自动化仪表防护架