[发明专利]国产操作系统下汉藏语言数据的翻译管理及评估方法有效
申请号: | 202210155863.0 | 申请日: | 2022-02-21 |
公开(公告)号: | CN114217901B | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 余杰;刘晓东;彭龙;马俊;谭郁松;吴庆波 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06F9/451 | 分类号: | G06F9/451;G06F40/58 |
代理公司: | 苏州国诚专利代理有限公司 32293 | 代理人: | 陈松 |
地址: | 410000 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 国产 操作系统 藏语 数据 翻译 管理 评估 方法 | ||
本发明提供了一种国产操作系统下汉藏语言数据的翻译管理及评估方法,其可以对基于Linux的国产操作系统中大量软件数以千万计的藏语言数据进行统筹管理,有效降低国产操作系统汉藏语言维护的管理成本,包括以下步骤:解析基于Linux的国产操作系统下所有的软件源代码,获得源词条,构建源词条数据集;响应于源词条的翻译数据的更新,构建新增翻译数据与源词条的翻译映射关系;依据翻译映射关系,在国产操作系统中进行跨软件的待处理源词条检查,对于检测到存在待处理源词条的软件,进行翻译数据的更新或新增;对新增翻译数据进行翻译质量评估,输出翻译正确性的评估结果。
技术领域
本发明涉及翻译数据管理技术领域,特别涉及一种国产操作系统下汉藏语言数据的翻译管理及评估方法。
背景技术
伴随着计算机与计算机网络全面走向全球化和信息化,基于Linux的国产操作系统已经深入到不同国家、地区以及行业领域中,在全世界得到广泛而全面的使用。为了给我国西藏地区使用藏语言的国产操作系统用户提供友好一致的用户界面和交互体验,国产操作系统的藏语言支撑适配是现代国产操作系统的重要研究方向。然而,由于国产操作系统需支持的语言种类多、数据量大、数据持续构建和一致性维护困难,且相关翻译人员数量和翻译水平有限,使得国产操作系统的藏语言支撑适配面临巨大的研发难度和管理压力,成为了国产操作系统藏语言本地化的难题。
国产操作系统系统往往包含数千款软件。现有藏语言支撑框架以软件级维护为主,主要以单个软件为最小单位进行藏语言本地化维护,具有零碎化、数据关联差、管理成本高等缺点。
发明内容
针对上述问题,本发明提供了一种国产操作系统下汉藏语言数据的翻译管理及评估方法,其可以对基于Linux的国产操作系统中大量软件数以千万计的藏语言数据进行统筹管理,有效降低国产操作系统汉藏语言维护的管理成本。
其技术方案是这样的:国产操作系统下汉藏语言数据的翻译管理及评估方法,包括以下步骤:
解析基于Linux的国产操作系统下所有的软件源代码,获得源词条,构建源词条数据集;
响应于源词条的翻译数据的更新,构建新增翻译数据与源词条的翻译映射关系;
依据翻译映射关系,在国产操作系统中进行跨软件的待处理源词条检查,对于检测到存在待处理源词条的软件,进行翻译数据的更新或新增;
对新增翻译数据进行翻译质量评估,输出翻译正确性的评估结果。
进一步的,所述源词条的翻译数据的更新,通过如下步骤获得:通过交互式web服务提供源词条数据集的翻译服务,收录翻译人员翻译得到的新增翻译数据。
进一步的,所述构建新增翻译数据与源词条的翻译映射关系,具体包括以下步骤:
对源词条进行语言合法性校验,对于检测合法的源词条,检测源词条是否存在源词条数据集中,将检测到不合法或对应的源词条不在源词条数据集中的源词条作为非法数据进行废弃;
对于通过语言合法性检测且存在于源词条数据集中的源词条,继续检测源词条是否存在翻译数据,若源词条存在翻译数据,更新关联的翻译映射关系,如果不存在翻译数据,构建新的翻译映射关系。
进一步的,若源词条不是合法的汉语或藏语的自然语言,在交互式web服务中提供报错或警告。
进一步的,在对藏语言的源词条进行语言合法性校验时,通过识别藏语言文本数据的ISO 639 语言标识码,分析源词条是否为合法自然语言。
进一步的,响应于翻译映射关系的更新或者新建,生产关联的翻译更新事件,响应于翻译更新事件的产生,从翻译更新事件中解析得到待处理源词条,在国产操作系统中全部软件中进行待处理源词条检查。
进一步的,所述对于检测到存在待处理源词条的软件,进行翻译数据的更新或新增,具体包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210155863.0/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置