[发明专利]用于自动化的文档翻译的技术在审
申请号: | 201711135156.0 | 申请日: | 2012-11-02 |
公开(公告)号: | CN107783967A | 公开(公告)日: | 2018-03-09 |
发明(设计)人: | S·康迪;C·里德 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 永新专利商标代理有限公司72002 | 代理人: | 张扬,王英 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 自动化 文档 翻译 技术 | ||
1.一种系统,包括:
至少一个处理器;以及
耦合到所述至少一个处理器的存储器,所述存储器包括计算机可执行指令,所述计算机可执行指令在被所述至少一个处理器执行时,执行用于提供连续的双手触摸打字的方法,所述方法包括:
从原始文档提取可翻译内容;
从所提取的可翻译内容创建多个中间文档,其中,所述多个中间文档包括所提取的可翻译内容;
将所述多个中间文档传送给翻译服务,所述翻译服务用于从第一语言到第二语言的翻译;
从所述翻译服务接收一个或多个经翻译的中间文档;
从所述一个或多个经翻译的中间文档提取经翻译内容;以及
构建包括所述经翻译内容的经翻译文档。
2.根据权利要求1所述的系统,其中,从所述原始文档提取所述可翻译内容还包括:
标识所述原始文档中的一个或多个段落;
从所述一个或多个段落中提取文本;
生成所提取的文本的一个或多个样式标识符;
标识一个或多个文本连续;以及
生成所述原始文档中的内联对象的一个或多个注释标识符。
3.根据权利要求2所述的系统,其中,从所提取的可翻译内容创建所述多个中间文档包括:
为每一所标识的段落创建段落标签;
标识每一段落的主要样式标识符;
将每一段落与其主要样式标识符进行关联;
标识每一段落中的中断样式连续;
为每一中断样式连续创建样式标签;以及
根据所述注释标识符来创建注释标签。
4.如权利要求3所述的系统,其中,所标识的段落中的一个或多个被存储为存储数据,所述存储数据包括具有相关联的样式标识符的文本连续的集合,其中,所述存储数据可用于在不存储用于所述一个或多个所标识的段落的实际文本格式化选项的情况下为所述一个或多个所标识的段落重新构建格式化。
5.根据权利要求3所述的系统,其中,从所述经翻译的中间文档提取所述经翻译内容包括:
标识所述经翻译的中间文档中的一个或多个经翻译段落;
从所述一个或多个经翻译段落中提取经翻译文本;
将每一经翻译段落的所述经翻译文本与该经翻译段落的所述相关联的主要样式标识符进行关联;
标识每一经翻译段落中的经翻译的中断样式连续;
将样式标识符与每一所标识的经翻译的中断样式连续的文本进行关联;
标识所述经翻译的中间文档中的注释;以及
将来自所标识的注释的注释标识符与它们在所提取的经翻译文本中的位置进行关联。
6.根据权利要求5所述的系统,其中,基于所提取的经翻译内容来构建所述经翻译文档包括:
用从所述经翻译文档的经翻译的段落所提取的经翻译文本替换来自所述原始文档的一个或多个段落的文本,其中,样式是使用所述相关联的样式标识符来分配给所提取的经翻译文本的,其中,来自所述原始文档的所述内联对象是基于与所提取的经翻译文本相关联的注释标识符来置于所述经翻译文档中的。
7.根据权利要求1所述的系统,所述方法还包括:
基于所述原始文档的文档类型来针对所述原始文档从多个翻译解析器中选择翻译解析器;
使用所选的翻译解析器从所述原始文档提取所述可翻译内容;以及
使用所选的翻译解析器基于所提取的经翻译内容来构建所述经翻译文档。
8.根据权利要求7所述的系统,所述方法还包括:
从所提取的可翻译内容创建所述多个中间文档以适应所述翻译服务的定义的页面数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711135156.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:道路桥梁收费站无线语音系统
- 下一篇:蓝牙收音机测试装置