[发明专利]从图片中自动提取双语词典的方法及装置有效
申请号: | 201310746535.9 | 申请日: | 2013-12-30 |
公开(公告)号: | CN103714055A | 公开(公告)日: | 2014-04-09 |
发明(设计)人: | 王海峰;马艳军 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28;G06F17/27 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种从图片中自动提取双语词典的方法及装置,其中,从图片中自动提取双语词典的方法包括:分别采用第一语言图片语义标注器和第二语言图片语义标注器对至少两个图片进行标注,根据第一语言图片语义标注器和第二语言图片语义标注器的输出,生成至少两个均包含第一语言语义标签和第二语言语义标签的双语句对;以及采用最大期望(EM)算法对生成的双语句对进行词对齐,提取出双语词典词条。本发明实施例,通过生成至少两个双语句对,采用EM算法对双语句对进行词对齐,从而可以从图片中自动提取出双语词典词条,而不需要依赖双语文本和网页资源,且实现简单、准确率高。 | ||
搜索关键词: | 图片 自动 提取 双语 词典 方法 装置 | ||
【主权项】:
一种从图片中自动提取双语词典的方法,其特征在于,包括:分别采用第一语言图片语义标注器和第二语言图片语义标注器对至少两个图片进行标注,根据所述第一语言图片语义标注器和所述第二语言图片语义标注器的输出,生成至少两个均包含第一语言语义标签和第二语言语义标签的双语句对;以及采用最大期望EM算法对生成的所述双语句对进行词对齐,提取出双语词典词条。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310746535.9/,转载请声明来源钻瓜专利网。