[发明专利]一种跨语言文本检索系统及其方法在审
申请号: | 201911006144.7 | 申请日: | 2019-10-22 |
公开(公告)号: | CN112699212A | 公开(公告)日: | 2021-04-23 |
发明(设计)人: | 郭庆 | 申请(专利权)人: | 南京莱科智能工程研究院有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/58 |
代理公司: | 淮安睿合知识产权代理事务所(普通合伙) 32372 | 代理人: | 郭宗胜 |
地址: | 210000 江苏省南京市建*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语言 文本 检索系统 及其 方法 | ||
本发明涉及信息处理技术,具体涉及跨语言文本检索系统及其方法,包括机器翻译模块多个、目标语言检索请求构造模块、检索词列表形成模块、权值计算模块、云数据服务模块、翻译可信度计算模块和目标语言检索结果构造模块,所述机器翻译模块与目标语言检索请求构造模块通信连接,目标语言检索请求构造模块与检索词列表形成模块通信连接,检索词列表形成模块与权值计算模块通信连接,所述检索词列表形成模块和权值计算模块均与检索式生成模块通信连接,所述检索式生成模块与云数据服务模块通信连接,云数据服务模块与翻译可信度计算模块通信连接,云数据服务模块还与目标语言检索结果构造模块通信连接。
技术领域
本发明涉及信息处理技术,具体涉及跨语言文本检索系统及其方法。
背景技术
随着网络的普及,网络上的信息资源日益丰富且用户对于网络信息资 源的需求也在逐渐提高。但是,在网络信息资源日益丰富的同时,却又存 在着阻碍这些资源为用户所广泛共享的一个主要障碍一多语种问题。其原 因在于,目前网络用户获得网络信息资源的一个主要途径是通过信息检索 系统,但传统的信息检索系统主要是针对于单一语种的文档集而实现的。 也就是说,传统的信息检索系统一般允许用户选择某一语种作为查询语言, 但仅向用户返回符合其查询条件的、与该查询语言相同的语种的文档。
目前,由于用户需要查询多语种文本的情形已变得越来越普遍,所以, 为了满足人们对于不同语种的网络信息资源的共享需求,跨语言信息检索 技术正在受到广泛的关注及普遍的应用。
跨语言信息检索技术是结合了传统文本信息检索技术和机器翻译 (machinetranslation,MT)技术的一门热点技术。跨语言信息检索系统 使得用户能够以其选定的源语言提交检索请求,而对目标语言地文档进行 检索。具体地,在跨语言信息检索系统中,广泛地使用基于机器翻译系统 的查询翻译方法来实现上述跨语言的信息检索。也就是说,跨语言信息检 索系统首先利用基于机器翻译系统的查询翻译方法自动地将用户的检索请求从其源语言翻译到目标语言,从而得到该检索请求的目标语言译文,然 后再根据该目标语言译文来构造与该检索请求对应的目标语言检索请求, 从而使该跨语言信息检索系统能够利用该目标语言检索式对符合查询条件 的目标语言的文档进行单语检索。
但是,在以往的跨语言信息检索系统中,通常都直接使用单个机器翻 译系统来生成检索请求的目标语言译文、进而构造检索式,从而这样的跨 语言信息检索系统的检索性能极大地取决于机器翻译系统所生成的检索请 求译文的质量。从而,当机器翻译系统的译文质量较差时,直接使用该机 器翻译系统所生成的检索请求的译文来构造检索式,通常也会使得跨语言 信息检索系统得到质量较差的检索结果。
因此,需要设计出一种新的跨语言检索请求的转换技术以及跨语言信 息检索技术,来提高跨语言信息检索系统的检索性能。
发明内容
本发明的目的是为了解决上述技术不足,提供了一种跨语言文本检索系统及其方法。
为解决上述技术问题,本发明所采用的技术方案为:一种跨语言文本检索系统,包括机器翻译模块多个、目标语言检索请求构造模块、检索词列表形成模块、权值计算模块、云数据服务模块、翻译可信度计算模块和目标语言检索结果构造模块,所述机器翻译模块与目标语言检索请求构造模块通信连接,目标语言检索请求构造模块与检索词列表形成模块通信连接,检索词列表形成模块与权值计算模块通信连接,所述检索词列表形成模块和权值计算模块均与检索式生成模块通信连接,所述检索式生成模块与云数据服务模块通信连接,云数据服务模块与翻译可信度计算模块通信连接,云数据服务模块还与目标语言检索结果构造模块通信连接。
作为优选,所述翻译可信度计算模块还和目标语言检索结果构造模块通信连接。
为解决上述技术问题,本发明所采用的技术方案为:一种跨语言文本检索方法,包括如下步骤:步骤一:机器翻译模块对文本进行编码收集,从而实现对目标语言进行收集,进而对目标语言的文字进行翻译;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京莱科智能工程研究院有限公司,未经南京莱科智能工程研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911006144.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:漏电保护装置及电连接设备
- 下一篇:一种配置导频序列的方法及装置