[发明专利]一种文档文字的处理方法有效
申请号: | 201610122855.0 | 申请日: | 2016-03-04 |
公开(公告)号: | CN105808528B | 公开(公告)日: | 2019-01-25 |
发明(设计)人: | 张广睿 | 申请(专利权)人: | 张广睿 |
主分类号: | G06F17/28 | 分类号: | G06F17/28;G06F17/25 |
代理公司: | 成都天嘉专利事务所(普通合伙) 51211 | 代理人: | 邓小兵 |
地址: | 四川省成都市青*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种文档文字的处理方法,包括以下步骤:(1)、提取待翻译文档中的文字信息,并统一格式;(2)、将文档自动拆分成最小单位的待译文字数据集合,去掉待译文字数据集合中的非译文字和重复的待译文字数据;(3)、建立译前处理文档,先将待译文字数据集合中的待译文字数据复制到原文列中,再将涉及到的专有术语的原文和译文写入对应的专有术语列,得到匹配有专有术语的译前处理文档;(4)、译员对译前处理文档中原文列对应的待译文字数据翻译,得到译后处理文档;(5)、使用替换功能将译文替换成原文,得到译文。本发明能够处理文档前预先去除文档中重复的单词、词组或单句,达到简化译员翻译量、提高翻译效率的目的。 | ||
搜索关键词: | 一种 文档 文字 处理 方法 | ||
【主权项】:
1.一种文档文字的处理方法,其特征在于包括以下步骤:(1)、提取待翻译文档中的文字信息,并统一文字信息的格式,得到格式统一的文档;(2)、对格式统一的文档进行拆分,将其拆分成以单词、词组、单句中的任意一种或几种为最小单位的待译文字数据集合,去掉非译文字后再去掉待译文字数据集合中重复的待译文字数据,然后将剩下的每一个待译文字数据依次与笔译记忆库中的内容进行比对,而后删除待译文字数据集合中与笔译记忆库中相重复的内容;其中,所述的笔译记忆库中设置有原文列一和译文列一,原文列一中存储有已译文档的原文,译文列一中对应存储有已译文档的译文;(3)、建立一个译前处理文档,并在该译前处理文档中设置原文列、译文列和专有术语列,先将经步骤(2)处理后的待译文字数据集合中的每一个待译文字数据按顺序复制到原文列中,再根据预先制作的专有术语表,将每一个待译文字数据中涉及到的专有术语的原文和译文写入对应的专有术语列,最后得到匹配有专有术语的译前处理文档;(4)、由译员对经步骤(3)得到的匹配有专有术语的译前处理文档中原文列对应的所有待译文字数据进行翻译,并将译文填写至对应的译文列,得到译后处理文档;(5)、先将待翻译文档中与译后处理文档中的原文列相同的待译文字数据替换成译文,再使用原文列一中原文所对应的译文列一中的译文替换待翻译文档中出现在原文列一中的原文,最后得到与待翻译文档相同格式的译文。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于张广睿,未经张广睿许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610122855.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种钻模工装
- 下一篇:一种铜管冲孔工艺专用装置