[发明专利]翻译文案的质量检验方法、装置、设备及存储介质在审
申请号: | 202110468240.4 | 申请日: | 2021-04-28 |
公开(公告)号: | CN113177421A | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 闫洋铭 | 申请(专利权)人: | 探探文化发展(北京)有限公司 |
主分类号: | G06F40/51 | 分类号: | G06F40/51;G06F40/216;G06F40/289;G06F40/30 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100621 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 翻译 文案 质量检验 方法 装置 设备 存储 介质 | ||
本发明实施例公开了一种翻译文案的质量检验方法、装置、设备及存储介质。包括:获取翻译文案以及对应的源文案;基于所述源文案对所述翻译文案进行如下至少一项的质量检验:占位符一致性检验、语义一致性检验、渲染模式检验、超长文本检验及格式检验。可以全面的对多语言的翻译文案的质量进行检验,提高翻译文案质量检验的可靠性。
技术领域
本发明实施例涉及文本处理技术领域,尤其涉及一种翻译文案的质量检验方法、装置、设备及存储介质。
背景技术
应用程序(Application,app)或者web界面为了支持多国语言显示,就必须集成多语言文案内容,在切换语种时,所有页面的语言或文案将显示为对应语言的翻译文案,这种能力称之为具备多语言能力。实现原理大致为:当检测到系统语言为外语时(例如英语、日语、韩语等),应用内所有需要渲染文字的地方(按钮文案、输入框文案、标签文案、提示文案等)将会获取对应的多语言文案并进行渲染和显示。但是在多语言文案的加载和最终展示过程中,会暴露很多多语言质量问题,这些问题大致分为两类:显示异常和功能异常。
目前,对翻译文案的质量检测的方式为测试人员在应用中分别加载不同的多语言文案进行实际的操作并观察应用的显示和功能情况,这种测试方式有两个最大的问题:极其耗费成本(人力、时间);无法100%覆盖所有的文案。耗费成本在于需要多人花费大量时间实际使用app并进行验证,没有任何一个测试人员可以保证自己可以完整使用或测试app所有场景中的所有文案内容,使得检测无法做到100%覆盖。
发明内容
本发明实施例提供一种翻译文案的质量检验方法、装置、设备及存储介质,可以全面的对多语言的翻译文案的质量进行检验,提高翻译文案质量检验的可靠性。
第一方面,本发明实施例提供了一种翻译文案的质量检验方法,包括:
获取翻译文案以及对应的源文案;
基于所述源文案对所述翻译文案进行如下至少一项的质量检验:占位符一致性检验、语义一致性检验、渲染模式检验、超长文本检验及格式检验。
进一步地,基于所述源文案对所述翻译文案进行占位符一致性检验,包括:
提取所述源文案中的第一占位符以及所述翻译文案中的第二占位符;
将所述第一占位符和所述第二占位符进行数量及形式的匹配;
若所述第一占位符与所述第二占位符的数量及形式均匹配,则所述翻译文案的占位符一致性检验通过。
进一步地,基于所述源文案对所述翻译文案进行语义一致性检验,包括:
对所述源文案进行分词处理,获得至少一个源分词;
从设定语料库获取所述至少一个源分词对应的至少一个翻译分词;所述设定语料库存储有分词的多语言表达方式;
将所述至少一个翻译分词与所述翻译文案进行比对,若所述至少一个翻译分词在所述翻译文案中的覆盖率超过设定阈值,则所述翻译文案的语义一致性检验通过。
进一步地,基于所述源文案对所述翻译文案进行渲染模式检验,包括:
若所述源文案为渲染模式,则获取所述源文案对应的内容代码文本和渲染代码文本;其中,所述渲染代码文本包括代码关键字段和渲染内容;
若所述内容代码文本中的渲染标签完整、所述代码关键字段以设定渲染字符结尾且所述渲染内容是所述源文案内容的子集,则所述翻译文案的渲染模式检验通过。
进一步地,基于所述源文案对所述翻译文案进行超长文本检验,包括:
提取所述源文案的第一字符数量以及所述翻译文案的第二字符数量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于探探文化发展(北京)有限公司,未经探探文化发展(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110468240.4/2.html,转载请声明来源钻瓜专利网。