[发明专利]基于领域本体的名片信息中译英自动翻译方法无效
申请号: | 200710304514.6 | 申请日: | 2007-12-28 |
公开(公告)号: | CN101216819A | 公开(公告)日: | 2008-07-09 |
发明(设计)人: | 张玉洁;孟祥武 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F17/28 | 分类号: | G06F17/28;G06F17/30 |
代理公司: | 北京汇泽知识产权代理有限公司 | 代理人: | 张颖玲 |
地址: | 100088*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于领域本体的名片信息中译英自动翻译方法,包括为名片中所包括信息建立领域本体库及翻译本体库;向用户提供名片信息输入界面,接收用户名片的联系地址、邮编、联系人名称、职位、单位名称、联系电话、传真的信息输入,或直接调用数据库中的用户电子名片,提取联系地址、邮编、联系人名称、职位、单位名称、联系电话、传真的信息;获取用户输入的参数值,进行切分和语法分析,进行匹配翻译;以及输出翻译结果并接收用户的修订,将修订结果存储到数据库中。本发明所提供的英文翻译准确率相当高,实用性强。 | ||
搜索关键词: | 基于 领域 本体 名片 信息 中译英 自动 翻译 方法 | ||
【主权项】:
1.一种基于领域本体的名片信息中译英自动翻译方法,其特征在于,以词料库、语料库为基础,为名片中所包括信息建立领域本体库,所述领域本体库中至少包括地址领域类、户名领域类、单位名称类,其中,所述联系地址类至少包括:地址分割符、前缀词汇、地址小节和地址,为地址分割符、前缀词汇、地址小节和地址设置属性及属性值,同时为所述地址分割符、前缀词汇、地址小节和地址建立实例;所述户名领域类至少包括:地址标识、地址自定义称谓、户名标识和子户名、户名,为所述地址标识、地址自定义称谓、户名标识和子户名设置属性及属性值,同时为所述地址标识、地址自定义称谓、户名标识和子户名建立实例;所述属性及属性值是依据所述词料库、语料库训练而得到的语义而设置的;单位名称类是收集单位名称,并建立之间的语义联系;即领域本体库是基于语义关联的关系数据库;以英汉词典、汉英词典和汉英语法规则建立单词、词句的语法翻译实例,同时建立翻译实例与领域本体库中的各元素所建立实例之间的对应关系;该方法还包括以下步骤:A、向用户提供名片信息输入界面,接收用户名片的联系地址、邮编、联系人名称、职位、单位名称、联系电话、传真的信息输入;B、获取联系地址、邮编、联系人名称、职位、单位名称、联系电话、传真的参数值,对于邮编、联系电话、传真的信息,进行直译,用户输入的数字参数不译;对于联系人名称,判断是否为汉语,若是按名和姓进行切分,查找所述翻译本体库是否有匹配的名,若有则译为相应英文,否则译为拼音,如果不是汉语则不译;对于职位,则直接输入到翻译本体库进行匹配,若匹配则将对应的英文翻译作为输出,不匹配时则翻译为汉语拼音;对于联系地址,则以用户输入的参数值为查询条件,在领域本体库的地址领域类、户名领域类进行匹配,若存在匹配项,则按领域本体库中的切词方式对联系地址及单位名称进行切词,再查找这些切词对应的翻译实例,再根据实例中训练的英文语法翻译规则进行翻译;若不存在匹配项,则直接进行切词,将每个切词输入到领域本体库进行匹配,若匹配则获得每个切词的翻译结果,若不匹配则翻译为汉语拼音,根据实例中训练的英文语法翻译规则进行翻译;对于单位名称则输入到单位名称类中进行匹配,匹配成功则按设定的规则进行翻译,否则以汉语拼音作为翻译结果;C、将翻译后的联系地址、邮编、联系人名称、职位、单位名称、联系电话、传真的信息输出,并接收用户的修正,修正结果作为翻译结果输出;则将用户修正的词句结果保存到翻译本体库中的对应实例中,并更新实例中该修正词句的翻译结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200710304514.6/,转载请声明来源钻瓜专利网。
- 上一篇:免疫原性组合物
- 下一篇:一种现浇砼空心板用空腔模壳构件