[发明专利]基于多语言翻译的近义词关联方法在审
申请号: | 201410839087.1 | 申请日: | 2014-12-30 |
公开(公告)号: | CN104537066A | 公开(公告)日: | 2015-04-22 |
发明(设计)人: | 陈立杰;李之光 | 申请(专利权)人: | 郑州市中业科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 郑州大通专利商标代理有限公司 41111 | 代理人: | 陈勇;申文涛 |
地址: | 450002 河南省郑*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 语言 翻译 近义词 关联 方法 | ||
技术领域
本发明涉及网络数据检索和语义分析领域,特别涉及一种基于多语言翻译的近义词关联方法。
背景技术
对于日常检索,通常情况只能检索出包含检索关键字的信息,如果需要检索包含关键字的相关同义词或者近义词信息,通常会变得非常困难;如果在多语言环境下实现关键字的检索,几乎是不可能完成这样的工作。但不论专业的多语言的翻译还是日常的跨多语言的信息检索,都需要解决这个难题。
发明内容
针对现有技术中的多语言翻译或跨语言的同义词检索难题,本发明提供一种基于多语言翻译的近义词关联方法,适用于信息检索、搜索引擎、语言翻译等,解决多种语言互译、跨语言近义词同义词关联的难点。
按照本发明所提供的设计方案,一种基于多语言翻译的近义词关联方法,包含如下步骤:
步骤1、 将待翻译信息转化为源文字信息;
步骤2、 根据不同语言,将转化的源文字信息存入文字处理单元,对文字处理单元存储的源文字信息进行分词断句,源文字信息、分词断句后的信息形成一条元素记录存入结果集,并赋予该条元素记录身份标签标识和时间标签标识,若判定不同语言的词组具有相同的涵义,则赋予该词组统一标签标识,若判定同一语言的词组具有相同的涵义,则赋予近义标签标识,并对该条元素记录中的统一标签和近义标签加密处理,对具有相同的近义标签和统一标签的元素记录赋予相同的父标签;
步骤3、 根据元素记录中的关键字进行信息关联数据库检索,查找是否有对应的记录,若有,则完成关联;否则,进入下一步骤;
步骤4、 将步骤2中赋予身份标签、时间标签、统一标签、近义标签和父标签的元素记录存储到信息关联数据库中,供用户进行信息关联数据库检索。
上述的,步骤1中的待翻译信息包含语音信息、文本信息、图像信息及视频信息,语音信息通过语音识别转化为源文字信息,图像信息通过图像识别转化为源文字信息,视频信息通过视频识别转化为源文字信息。
上述的,步骤2的分词断句包含文字处理单元根据不同语言语系对源文字信息进行分词断句,若源文字信息为拉丁语系,按照空格进行分词,并存入结果集;若源文字信息为东方语系,则先单字拆解,重新组合成词组,并与该语系词库进行匹配,若匹配成功,则为有效词组,否则,视为无效词组,将单字及该有效词组存入结果集,将结果集中的词组与信息关联数据库进行匹配,如果词组匹配成功,则视为已关联词组,从结果集中移除。
本发明基于多语言翻译的近义词关联方法的有益效果:
本发明适用于信息检索、搜索引擎、语言翻译等,解决多种语言互译、跨语言近义词同义词关联的难点,将每条元素记录均赋予唯一的身份标识,不同语言的词组具有相同的涵义,则赋予该词组统一标签标识,同一语言的词组具有相同的涵义,则赋予近义标签标识,并对该条元素记录中的统一标签和近义标签加密处理,当跨语言的多个元素记录具有相同的统一标签或近义标签,则证明其之间是跨语言的近义词或同义词,可以方便的检索出输入的关键字的近义或同义的详细信息,实现跨语言的同义词及近义词之间的匹配,提高信息检索、语言翻译的效率。
附图说明:
图1为本发明基于多语言翻译的近义词关联方法的流程示意图;
图2为本发明的结果集存储示意图;
图3为本发明的标签关联方法示意图;
图4为本发明的实施例关联示意图。
具体实施方式:
下面结合附图和技术方案对本发明作进一步详细的说明,并通过优选的实施例详细说明本发明的实施方式,但本发明的实施方式并不限于此。
实施例:参见图1~4所示,一种基于多语言翻译的近义词关联方法,包含如下步骤:
步骤1、 将待翻译信息转化为源文字信息;
步骤2、 根据不同语言,将转化的源文字信息存入文字处理单元,对文字处理单元存储的源文字信息进行分词断句,源文字信息、分词断句后的信息形成一条元素记录存入结果集,并赋予该条元素记录身份标签标识和时间标签标识,若判定不同语言的词组具有相同的涵义,则赋予该词组统一标签标识,若判定同一语言的词组具有相同的涵义,则赋予近义标签标识,并对该条元素记录中的统一标签和近义标签加密处理,对具有相同的近义标签和统一标签的元素记录赋予相同的父标签;
步骤3、 根据元素记录中的关键字进行信息关联数据库检索,查找是否有对应的记录,若有,则完成关联;否则,进入下一步骤;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州市中业科技有限公司;,未经郑州市中业科技有限公司;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410839087.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电子地图接入方法和装置
- 下一篇:一种电子文档的更新方法及装置