[发明专利]篇章翻译的方法、装置、电子设备和可读存储介质在审
| 申请号: | 202010561778.5 | 申请日: | 2020-06-18 |
| 公开(公告)号: | CN111859998A | 公开(公告)日: | 2020-10-30 |
| 发明(设计)人: | 张传强;张睿卿;何中军;李芝;吴华 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/30 |
| 代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙) 11412 | 代理人: | 田宏宾 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 篇章 翻译 方法 装置 电子设备 可读 存储 介质 | ||
本申请公开了一种篇章翻译的方法、装置、电子设备和可读存储介质,涉及自然语言处理技术领域。本申请在进行篇章翻译时所采用的实现方案为:获取源语言篇章;确定所述源语言篇章的主题词语;结合所述主题词语对所述源语言篇章进行翻译,生成对应所述源语言篇章的目标语言篇章。本申请能够提升篇章翻译的准确性等。
技术领域
本申请涉及计算机技术领域,尤其涉及自然语言处理技术领域中的一种篇章翻译的方法、装置、电子设备和可读存储介质。
背景技术
篇章是由具有衔接性和连贯性的一连串句子组成的,其不仅仅是一连串句子的集合,更是一个结构完整、功能明确的语义统一体。现有技术在进行篇章的翻译时,通常是将篇章中的句子切分出来之后,对每一个句子进行单独翻译,然后将各句子的翻译结果进行拼接,从而得到篇章的翻译结果。
但是,现有技术在使用上述方式对内容连贯的篇章进行翻译时,往往会出现翻译不准确问题。例如,若篇章中的一个句子为“It starts with modeling”,现有技术会将该句子翻译为“从造型开始”,但是该篇章所描述的是关于动画渲染的内容,因此将“modeling”翻译为“造型”并不准确。
发明内容
本申请为解决技术问题所采用的技术方案是提供一种篇章翻译的方法,包括:获取源语言篇章;确定所述源语言篇章的主题词语;结合所述主题词语对所述源语言篇章进行翻译,生成对应所述源语言篇章的目标语言篇章。
本申请为解决技术问题所采用的技术方案是提供一种篇章翻译的装置,包括:获取单元,用于获取源语言篇章;确定单元,用于确定所述源语言篇章的主题词语;翻译单元,用于结合所述主题词语对所述源语言篇章进行翻译,生成对应所述源语言篇章的目标语言篇章。
上述申请中的一个实施例具有如下优点或有益效果:本申请能够提升篇章翻译的准确性等。因为采用了通过获取源语言篇章的主题词语对源语言篇章进行翻译的技术手段,所以克服了现有技术仅考虑篇章中的当前源语言句子进行翻译所导致的翻译不准确的技术问题,实现了提升篇章翻译的准确性的技术效果。
上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是根据本申请第一实施例的示意图;
图2是根据本申请第二实施例的示意图;
图3是根据本申请第三实施例的示意图;
图4是用来实现本申请实施例的篇章翻译的方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本申请第一实施例的示意图。如图1中所示,本实施例的篇章翻译的方法,具体可以包括如下步骤:
S101、获取源语言篇章;
S102、确定所述源语言篇章的主题词语;
S103、结合所述主题词语对所述源语言篇章进行翻译,生成对应所述源语言篇章的目标语言篇章。
本实施例的篇章翻译的方法,通过获取源语言篇章的主题词语对源语言篇章进行翻译,能够确保所生成的目标语言篇章中各句子的翻译结果与篇章主题相对应,从而避免了翻译错误的产生,提升了篇章翻译的准确性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010561778.5/2.html,转载请声明来源钻瓜专利网。





