[发明专利]一种机器与人工翻译相融合的口语翻译方法和装置有效

专利信息
申请号: 201410090457.6 申请日: 2014-03-12
公开(公告)号: CN104050160B 公开(公告)日: 2017-04-05
发明(设计)人: 高鹏 申请(专利权)人: 北京紫冬锐意语音科技有限公司
主分类号: G06F17/28 分类号: G06F17/28;G06F17/30
代理公司: 中科专利商标代理有限责任公司11021 代理人: 宋焰琴
地址: 100191 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 机器 人工 翻译 融合 口语翻译 方法 装置
【说明书】:

技术领域

发明涉及计算机信息自动处理领域,具体涉及一种机器与人工翻译相融合的口语翻译方法和装置。

背景技术

自动翻译系统的研究开发已经进行了50年了——事实上自从本世纪40年代电子计算机诞生之日起就开始了计算机应用于语音翻译的探索。从上个世纪80年代末期以来,人们开始致力于语音翻译(Speech-to-speech Translation)技术的研究。所谓的语音翻译就是让计算机实现从一种语言的语音到另一种语言的语音翻译的过程。其基本设想是,让计算机像人一样充当持不同语言的说话人之间翻译的角色。由于说话人使用的语言一般都是日常生活中的口语,而人们也正希望计算机翻译系统可以接受并实现任意口语语句的翻译,并且,这种希望随着语音识别技术和口语解析技术的快速发展和提高,已经成为不再渺茫的设想。因此,语音翻译又常被称作口语翻译(Spoken Language Translation,SLT)。

口语翻译涉及自动语音识别、机器翻译、语音合成等多种学科和技术,因此具有重大的研究意义。在上个世纪90年代早期,伴随着语音识别技术的不断提高,口语翻译逐渐蓬勃发展起来。随着其核心技术的不断发展,口语翻译不再是限定于某个领域内的高质量翻译,而要以实现不同语言之间的交流为目标。口语翻译中的研究侧重于以下几个方面:1)在交互式的语音翻译中挖掘对话结构;2)研究书面语与口语的不同;3)处理系统的性能和鲁棒性问题。近年来,随着语音识别中统计框架的建立,在机器翻译以及口语翻译中越来越多的系统开始使用统计方法进行建模。并且传统的口语翻译系统,由于受到技术限制,只能应用在某些语音受限的环境下,而当前技术的主要挑战是如何解决现实生活中的口语交流问题。具体的应用场景从国际会议(包括体育运动会)信息综合服务到旅游信息咨询等,因此从社会与经济的角度来看,口语翻译(SLT)与我们这个日益全球化的世界有很大的相关性。

口语信息表达作为人们日常交流的一种主要沟通方式,语言表达的简洁性和使用范围的广泛性越来越受到人们的重视。开发基于口语信息内容处理的机器翻译系统,在便于使用和携带的嵌入式系统平台上应用成为人们开发实用性机器翻译系统的一个重要内容。但是,口语自身的一些特点使得实用性口语翻译系统的研发困难重重。口语翻译的主要困难在于1)在口语对话、网络聊天等真实场景中,输入的句子往往缺乏规范性,很难扑捉其内在的语法结构信息,造成统计翻译的结果较生硬、稳定性差等问题;2)统计机器翻译是以数据驱动的,其赖以生存的根基是双语数据资源。而在当前的数据积累中,面向口语的双语语料(中英)相当匮乏。因此目前,完全依赖统计方法的口语翻译系统并不能完全满足人们日常生活的广泛需求。3)口语翻译有别于文本翻译,其主要完成不同语言的人群的交流问题,因此其对翻译的实时性要求高,尤其在网络环境下如何优化翻译流程是提高用户体验的关键。

发明内容

本发明旨在提供一种机器与人工翻译相融合的口语翻译方法,可以解决单纯使用机器进行口语翻译,其结果生硬、稳定性差等问题,并通过不断积累以句子为单位的大规模口语翻译数据库,提高翻译的自动化程度,加速口语翻译系统的市场化进程。

根据本发明一方面,其提供了一种机器与人工翻译相融合的口语翻译方法,包括:

步骤1、识别连续的语音段落,并对其进行断句切分,得到以句子为单位的输入文本;

步骤2、根据所述输入文本进行数据库搜索,查找是否有对应的目标语句,若有则直接将目标语句以语音输出,否则转步骤3;

步骤3、使用机器翻译对所述输入文本进行翻译得到目标语句,并对所述目标语句进行置信度打分;

步骤4、由人工翻译所输入文本获得目标语句;

步骤5、根据所述机器翻译的翻译置信度评估以及人工翻译的质量进行评估,并采用语音合成的方法将评估较好的翻译目标语句生成韵律可调的语音输出。

根据本发明另一方法,其公开了一种机器与人工翻译相融合的口语翻译装置,包括:

语音识别与碎片化模块,识别连续的语音段落,并对其进行断句切分,得到以句子为单位的输入文本;

模版检索和替换模块,根据所述输入文本进行数据库搜索,查找是否有对应的目标语句,若有则直接将目标语句以语音输出,否则进入第一翻译模块;

基于层次短语的机器翻译模块,使用机器翻译对所述输入文本进行翻译得到目标语句,并对所述目标语句进行置信度打分;

智能的人工众包翻译模块,由人工翻译所输入文本获得目标语句;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京紫冬锐意语音科技有限公司,未经北京紫冬锐意语音科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410090457.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top