[发明专利]一种提高翻译精度的机器翻译系统及其方法在审
| 申请号: | 202010344432.X | 申请日: | 2020-04-27 |
| 公开(公告)号: | CN113642339A | 公开(公告)日: | 2021-11-12 |
| 发明(设计)人: | 付迎春 | 申请(专利权)人: | 北京雅信诚医学信息科技有限公司 |
| 主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/211;G06F40/284;G06N3/04;G06N3/08 |
| 代理公司: | 北京金智普华知识产权代理有限公司 11401 | 代理人: | 巴晓艳 |
| 地址: | 100124 北京市朝阳*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 提高 翻译 精度 机器翻译 系统 及其 方法 | ||
本发明涉及机器自动翻译技术领域,尤其涉及一种用于医疗器械和医学资料翻译的提高翻译精度的机器翻译系统及其方法,尤所述方法具体包括以下步骤:输入步骤,所述步骤用于将待翻译的源语言语句的输入;识别步骤,所述步骤用于输入的源语言语句进行识别;标准化检验步骤,所述步骤用于结合上下文对翻译后译文进行标准化检验,翻译步骤,所述步骤用于将完成检验和其它语句进行整句翻译;输出步骤,所述用于将翻译后整句整合后输出翻译全文。由于采用上述技术方案,本发明具有避免了因人工翻译需要将词的意思加语法连成局并结合语境、语音、语调再进行翻译,保证医学术语的标准化,无需要后续再次校对,降低了成本,提高了翻译的精度。
技术领域
本发明涉及机器自动翻译技术领域,尤其涉及一种用于医疗器械和医学资料翻译的提高翻译精度的机器翻译系统及其方法。
背景技术
目前,在医学领域中现有的统计机器翻译技术中由于有些词汇为专业词汇,这样使用普通的翻译器时,未登录词的出现频率较高,从而使翻译结果的准确性大大降低,一句话最终的翻译结果多处为“未知”。另一方面,机器翻译与人为翻译目前依然存在较大差异,因为机器翻译采用直接翻译的方法,即字、词加语法组合直接翻译,但是一个词会有很多种意思,通过语法连接也会产生很多种意思,而人工翻译需要将词的意思加语法连成局并结合语境、语音、语调再进行翻译,有的还需要进一步意译,这样很难保证在医学领域中很重要的一个环节,即医学术语的标准化,需要后续再次校对,提高了成本,大幅度降低了翻译的精度。
发明内容
本发明公开了一种提高翻译精度的机器翻译系统及其方法,以解决现有技术的上述以及其他潜在问题中任一问题。
为了解决上述技术问题,本发明的技术方案是:一种提高翻译精度的机器翻译系统,其特征在于,该系统包括:
输入单元,用于接受要翻译的源语言语句的输入;
识别模块,用于对输入的源语言语句进行识别,判断输入的源语言语句中是否含专业用语,并将专业用语提取出来,并确认译文;
标准化检验模块,用于将识别模块确认的译文结合上下文对翻译后译文进行标准化检验;
自动翻译模块,所述步骤用于将完成检验的专业用语的译文和其它语句进行整句翻译;
输出模块,用于将标准化的词语与普通词汇进行整合后输出。
进一步,所述系统还包括判定子单元模块,用于将判定输入的源语言语句是否为机器可识别语句,如果不是将其转换为机器可识别语句;
专业用语译文确认模块,用于将专业用语的整词根据专业用语数据库中译文进行翻译;
进一步,所述系统还包括转化模块,用于将翻译后专业用语的专用词输入Word2Vec模型转化为所述专用词的向量词,并计算相似度值,确定专用词的词向量与标准化表上专用词的向量词关系。
进一步,所述系统还包括录入模块:用于将没有对应到译文,录入,并收录入专业用语数据库中;
本发明的另一目的提供一种采用上述提高翻译精度的机器翻译系统的翻译方法,该方法具体包括以下步骤:输入步骤,所述步骤用于将待翻译的源语言语句的输入;
识别步骤,所述步骤用于输入的源语言语句进行识别是否有专业用语,如果有则提取出专业用语,否则直接翻译;
标准化检验步骤,所述步骤用于将提取出专业用语的译文结合上下文对进行标准化检验,
自动翻译步骤,所述步骤用于将完成检专业用语的译文和其它语句进行整句翻译;
输出步骤,所述用于将翻译后整句整合后输出翻译全文。
进一步,所述方法还包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京雅信诚医学信息科技有限公司,未经北京雅信诚医学信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010344432.X/2.html,转载请声明来源钻瓜专利网。





