[发明专利]一种文本翻译方法、装置及设备有效
申请号: | 201910272783.1 | 申请日: | 2019-04-04 |
公开(公告)号: | CN109977430B | 公开(公告)日: | 2023-06-02 |
发明(设计)人: | 熊新雷 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王雪;王宝筠 |
地址: | 230088 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 翻译 方法 装置 设备 | ||
1.一种文本翻译方法,其特征在于,所述方法包括:
确定待翻译文本中的数字词语;
将所述数字词语替换为预设占位符,并记录所述数字词语的位置信息;所述数字词语的位置信息用于表示所述数字词语与所述预设占位符的对应关系;
对带有所述预设占位符的待翻译文本进行翻译,得到带有所述预设占位符的翻译结果;
根据所述数字词语的位置信息,将所述翻译结果中的所述预设占位符替换为所述数字词语的阿拉伯数字形式或者目标语言形式;
其中,所述将所述数字词语替换为预设占位符,包括:
确定所述数字词语的类型以及合法性;
根据所述数字词语的类型以及合法性,将所述数字词语替换为预设占位符。
2.根据权利要求1所述的方法,其特征在于,所述根据所述数字词语的类型以及合法性,将所述数字词语替换为预设占位符,包括:
根据所述数字词语的类型以及合法性,将所述数字词语规整为阿拉伯数字;
将所述阿拉伯数字替换为预设占位符;
相应的,所述记录所述数字词语的位置信息,具体为,记录由所述数字词语规整的阿拉伯数字的位置信息。
3.根据权利要求2所述的方法,其特征在于,所述根据所述数字词语的位置信息,将所述翻译结果中的所述预设占位符替换为所述数字词语的阿拉伯数字形式或者目标语言形式,包括:
根据由所述数字词语规整的阿拉伯数字的位置信息,确定所述翻译结果中的预设占位符对应的阿拉伯数字;
将所述预设占位符替换为所述阿拉伯数字或者所述阿拉伯数字的目标语言形式。
4.根据权利要求1所述的方法,其特征在于,所述根据所述数字词语的类型以及合法性,将所述数字词语替换为预设占位符,包括:
根据所述数字词语的类型以及合法性,将所述数字词语直接替换为预设占位符。
5.根据权利要求4所述的方法,其特征在于,所述根据所述数字词语的位置信息,将所述翻译结果中的所述预设占位符替换为所述数字词语的阿拉伯数字形式或者目标语言形式,包括:
根据所述数字词语的位置信息,确定所述翻译结果中的预设占位符对应的数字词语;
将所述预设占位符替换为所述数字词语的阿拉伯数字形式或者目标语言形式。
6.根据权利要求5所述的方法,其特征在于,所述将所述预设占位符替换为所述数字词语的阿拉伯数字形式或者目标语言形式,包括:
将所述预设占位符替换为所述数字词语;
根据所述数字词语的类型以及合法性,将所述数字词语规整为阿拉伯数字。
7.根据权利要求1-6中任一项所述的方法,其特征在于,所述确定所述数字词语的类型以及合法性,包括:
确定所述数字词语是否属于预设类型,以及是否符合各个预设类型的合法性;所述预设类型包括整数类型、数字串类型和\或小数类型。
8.根据权利要求7所述的方法,其特征在于,所述确定所述数字词语是否属于预设类型,以及是否符合各个预设类型的合法性,包括:
判断所述数字词语是否包括位数词,如果是,则确定所述数字词语属于整数类型;所述位数词为用于作为单位的数字词;
以及,判断所述数字词语是否符合所述整数类型的预设合法条件,如果是,则确定所述数字词语属于所述整数类型且合法。
9.根据权利要求7所述的方法,其特征在于,所述确定所述数字词语是否属于预设类型,以及是否符合各个预设类型的合法性,包括:
依次遍历所述数字词语中的各个数字词,判断各个数字词是否均属于零到九之间的任意数字词;
如果各个数字词均属于零到九之间的任意数字词,则确定所述数字词语属于数字串类型且合法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910272783.1/1.html,转载请声明来源钻瓜专利网。