[发明专利]手机网络检索用语简称-全称转换识别方法及装置无效
申请号: | 201110307206.5 | 申请日: | 2011-10-12 |
公开(公告)号: | CN103049442A | 公开(公告)日: | 2013-04-17 |
发明(设计)人: | 卢玉成 | 申请(专利权)人: | 卢玉成 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100045 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 手机 网络 检索 用语 简称 全称 转换 识别 方法 装置 | ||
技术领域
本发明涉及数据检索技术领域,尤其与一种手机网络检索用语简称-全称转换识别方法及一种手机网络检索用语简称-全称转换识别装置有关。
背景技术
在日常交流和书面写作中,根据人们日常的思维习惯和语言习惯,人们经常使用缩略语来指代一个名称较长的实体名称,如用“北工大”来指代“北京工业大学”。
特别随着手机上网越来越普及,网络查询功能也越来越多地被广泛应用。但是,手机不像计算机具有操作屏幕大、查看方便、书写方便的特点,用户更希望通过词语缩略语的查询来获得自己需要的信息。因此,一种用手机网络用语简称来识别其全称的方法与装置就显得非常有必要。
全称(F)是对实体或对象的名称的完整称呼,简称(A)是为了表达的简洁明快,而对全称进行精简压缩后得到的称呼,若F和A具有全简称关系,则称F为A的全称,A为F的简称。简称处理问题就是对给定的一个简称A,设法了解它的全称。
简称处理问题已经成为自然语言处理、信息检索等应用中一个基本而又关键的问题。自然语言处理是计算机科学领域与人工智能领域中的一个重要问题。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。随着计算机和互联网的广泛应用,计算机可处理的自然语言文本数量空前增长,面向海量信息的文本挖掘、信息提取、跨语言信息处理、人机交互等应用需求急速增长,自然语言处理的对象也从小规模受限语言处理转向大规模真实文本处理,其研究必将对人们的生活产生深远的影响。信息检索,研究如何从纷繁复杂的大量信息中,快速、准确获取所需信息的技术。信息检索技术经过多年的发展,目前已经相当成熟,新型信息检索技术正朝智能化、动态化、多样化、个性化等方向发展。
解决网络用语检索的简称处理问题的方法可以分为两大类:一类是基于模式的方法,主要利用语言学和自然语言处理技术,通过词法分析和语法分析提取关系模式,然后利用模式匹配获取全简称关系,但该方法准确率难以达到理想的实用要求;另一类是基于统计的方法,主要基于语料库和统计语言模型,通过计算概念之间的关联度来获取全简称关系,该方法准确率虽高,但不能满足超大规模获取。
而其他一些处理全简称问题的方法,处理速度不高,难以应用于搜索引擎这样的实时系统中。
发明内容
针对现有技术中存在的问题,本发明的目的在于提供一种手机网络检索用语简称-全称转换识别方法,以解决现有技术手机网络检索用语简称-全称转换识别方法不能兼顾准确率和处理速度的技术问题。
本发明的另一个目的在于提供一种手机网络检索用语简称-全称转换识别装置。
为实现上述目的,本发明的技术方案如下:
一种手机网络检索用语简称-全称转换识别方法,包括步骤:将输入的简称分解为由一个一个单字组成的单字串;从一全称数据库中找出含有所述单字串中所有单字的全称串,如果找不到所述全称串,则输出没有匹配的全称;对找到的候选全称串,分别按照相关度公式进行评分,并将最大评分值所对应的候选全称串作为该简称所对应的全称进行输出。
一种手机网络检索用语简称-全称转换识别装置,包括全称数据库、输入单元、匹配单元、评分单元、比较器和输出单元;所述输入单元,接收一输入的简称;所述匹配单元,将所述输入单元所输入的所述简称分解为由一个一个单字组成的单字串;并从所述全称数据库中找出含有所述单字串中所有单字的全称串;所述评分单元,对找到的候选全称串,分别按照相关度公式进行评分;所述比较器,比较所述评分单元的评分,选出最大评分值;输出单元,如果找不到所述全称串,则由输出单元输出没有匹配的全称;否则将最大评分值所对应的全称串作为该简称所对应的全称进行输出。
本发明的有益效果在于,本发明的手机网络检索用语简称-全称转换识别方法,首先接收一个简称A作为输入,然后从一个全称数据库中找到A的侯选全称F1、...、Fn,最后根据特定的判断法则,挑选最好的一个(或多个)全称Fi,作为A的全称。本发明的方法具有较高的准确性和较快的处理速度,在含有2101个全称数据库(全国普通高校名称)的测试中,准确率达到97%。
附图说明
图1为本发明实施例的手机网络检索用语简称-全称转换识别方法的流程图。
图2为本发明实施例的手机网络检索用语简称-全称转换识别装置的示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于卢玉成,未经卢玉成许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110307206.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自适应全局优化概率搜索方法
- 下一篇:一种带空气净化功能的抽油烟机