[发明专利]文本翻译方法及装置有效
申请号: | 201711480227.0 | 申请日: | 2017-12-29 |
公开(公告)号: | CN108170686B | 公开(公告)日: | 2020-02-14 |
发明(设计)人: | 王亚楠;孟廷;刘俊华;魏思;胡国平 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58 |
代理公司: | 11002 北京路浩知识产权代理有限公司 | 代理人: | 苗青盛;马英迪 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例提供一种文本翻译方法及装置,属于语言处理技术领域。该方法包括:获取源文本对应的音素序列编码向量及词序列向量;其中,源文本对应的音素序列编码向量中包含的音素编码向量数与源文本对应的词序列向量中包含的词向量数相同;将源文本对应的音素序列编码向量与词序列向量输入至翻译模型,输出得到源文本对应的目标文本。由于在机器翻译的解码阶段之前,结合了词序列和音素序列进行编码,从而可利用音素序列对语音识别结果作容错处理,使得翻译后的目标文本能够更加准确地对应源语音信号。因此,翻译结果更加准确。 | ||
搜索关键词: | 音素序列 词序列 源文本 向量 编码向量 目标文本 文本翻译 语言处理技术 语音识别结果 机器翻译 翻译 翻译结果 解码阶段 容错处理 音素编码 词向量 获取源 源语音 文本 输出 | ||
【主权项】:
1.一种文本翻译方法,其特征在于,包括:/n获取源文本对应的音素序列编码向量及词序列向量;其中,所述源文本对应的音素序列编码向量由所述源文本中每一分词对应的音素编码向量所构成,所述源文本对应的词序列向量由所述源文本中每一分词对应的词向量所构成,所述源文本对应的音素序列编码向量中包含的音素编码向量数与所述源文本对应的词序列向量中包含的词向量数相同,所述源文本对应的音素序列编码向量中包含的音素编码向量数等于所述源文本中分词的总数量;/n将所述源文本对应的音素序列编码向量与词序列向量输入至翻译模型,输出得到所述源文本对应的目标文本。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711480227.0/,转载请声明来源钻瓜专利网。
- 上一篇:文本情感分析方法、装置和计算机可读存储介质
- 下一篇:一种自动英语翻译装置