[发明专利]基于知识图谱的神经机器翻译方法、装置、设备及介质在审
申请号: | 202111199951.2 | 申请日: | 2021-10-14 |
公开(公告)号: | CN114118104A | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 赵阳;张家俊;周玉;宗成庆 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/42;G06F16/36;G06N5/02;G06N5/04 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 谢志超 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 知识 图谱 神经 机器翻译 方法 装置 设备 介质 | ||
1.一种基于知识图谱的神经机器翻译方法,其特征在于,包括:
获取原始双语平行语句对,根据所述原始双语平行语句对提取单词和短语翻译对,得到对应的种子实体翻译对,其中,所述原始双语平行语句对包括原始源语言和原始目标语言;
获取所述原始源语言对应的源语言知识图谱和所述原始目标语言对应的目标语言知识图谱,根据所述种子实体翻译对、所述源语言知识图谱和所述目标语言知识图谱,构建对应的向量空间;
获取到待翻译实体集合时,根据所述向量空间对所述待翻译实体集合进行推断,得到对应的待翻译实体翻译对;
计算所述种子实体翻译对和所述待翻译实体翻译对的距离,根据所述距离得到包含所述待翻译实体翻译对的伪双语平行句对。
2.根据权利要求1所述的基于知识图谱的神经机器翻译方法,其特征在于,所述根据所述距离得到包含所述待翻译实体翻译对的伪双语平行句对的步骤包括:
确定所述距离是否小于第一预设距离阈值;
若所述距离小于所述第一预设距离阈值,则将所述种子实体翻译对的上下文迁移至所述待翻译实体翻译对的上下文,得到所述包含所述待翻译实体翻译对的伪双语平行句对。
3.根据权利要求1所述的基于知识图谱的神经机器翻译方法,其特征在于,所述根据所述种子实体翻译对、所述源语言知识图谱和所述目标语言知识图谱,构建对应的向量空间的步骤包括:
通过预设知识表示方法将所述源语言知识图谱和所述目标语言知识图谱,分别转化为对应的源语言知识向量和目标语言知识向量;
基于所述源语言知识向量和所述目标语言知识向量,构建对应的向量转化矩阵;
根据所述种子实体翻译对和所述向量转化矩阵,将所述源语言知识向量和所述目标语言知识向量进行映射,构建所述向量空间。
4.根据权利要求3所述的基于知识图谱的神经机器翻译方法,其特征在于,所述待翻译实体集合包括源语言实体集合和目标语言实体集合,
所述根据所述向量空间对所述待翻译实体集合进行推断,得到对应的待翻译实体翻译对的步骤包括:
通过所述向量转化矩阵将所述源语言实体集合或/和所述目标语言实体集合映射到所述向量空间中,得到对应的各个映射实体对;
确定各个所述映射实体对中两个实体之间的距离,得到对应的各个实体距离,并根据各个所述实体距离得到所述待翻译实体翻译对。
5.根据权利要求4所述的基于知识图谱的神经机器翻译方法,其特征在于,所述根据各个所述实体距离得到所述待翻译实体翻译对的步骤包括:
确定在各个所述实体距离中是否存在目标实体距离,其中,所述目标实体距离小于第二预设距离阈值;
若存在所述目标实体距离,则将所述目标实体距离对应的映射实体对,确定为所述待翻译实体翻译对。
6.根据权利要求1所述的基于知识图谱的神经机器翻译方法,其特征在于,所述根据所述原始双语平行语句对提取单词和短语翻译对,得到对应的种子实体翻译对的步骤包括:
根据所述原始源语言及其对应的原始目标语言提取单词和短语翻译对,得到原始源语言实体及其对应的原始目标语言实体;
将所述原始源语言实体及其对应的原始目标语言实体构建的实体对,确定为所述种子实体翻译对。
7.根据权利要求1至6任一项所述的基于知识图谱的神经机器翻译方法,其特征在于,所述根据所述距离得到包含所述待翻译实体翻译对的伪双语平行句对的步骤之后,还包括:
将原始双语平行语句对和伪双语平行句对确定为平行句对集合,并基于所述平行句对集合对原始翻译模型进行训练,得到对应的新的翻译模型;
获取到新的待翻译实体集合时,通过所述新的翻译模型对所述新的待翻译实体集合进行翻译,得到所述新的待翻译实体集合对应的伪双语平行句对。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111199951.2/1.html,转载请声明来源钻瓜专利网。