[发明专利]对POI信息进行分类的方法、装置和系统在审
申请号: | 201510379990.9 | 申请日: | 2015-07-01 |
公开(公告)号: | CN104915453A | 公开(公告)日: | 2015-09-16 |
发明(设计)人: | 郑燕琴 | 申请(专利权)人: | 北京奇虎科技有限公司;奇智软件(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市立方律师事务所 11330 | 代理人: | 张筱宁 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | poi 信息 进行 分类 方法 装置 系统 | ||
技术领域
本发明涉及计算机技术领域,具体而言,本发明涉及对POI信息进行分类的方法和装置。
背景技术
随着科技的发展和社会的进步,包括电子地图在内的地理信息服务以其方便快捷、直观可视化的特点,日益受到网民的欢迎,并广泛应用于各个生活领域,同时,各行各业对与位置相关的信息的获取需求愈来愈强烈,其中,与位置相关的信息可能包括某地址处的宾馆、机场、餐馆、银行、商场、医院、公园、加油站等,此类与位置相关的地理实体信息称为POI信息。由于此类POI信息将地理实体信息与地理位置信息相整合,因此能够给用户带来极大的便捷。为了进一步提高用户查询POI信息的效率,从而更好地帮助人们提高生活效率及生活质量,需要对POI位置信息进行分类。
现有技术中一般通过提取POI信息对应的网页中的文本内容,并基于文本内容与预定关键字进行匹配来确定POI信息的分类,即现有的POI信息分类方式中需要对POI信息对应的网页的全文文本做切词,随后将切分后的大量切分片段逐一与预定关键字进行匹配,如果匹配命中则该POI信息属于预定关键字对应的分类。
现有的POI信息分类方式的缺点主要包括:一方面,由于网页文本内容通常比较长,因此对网页文本进行切词的耗时较长,且切词后的得到的切分片段较多,使得关键字匹配次数也相应较多,因此总体分类运行效率较低;另一方面,POI信息对应的网页中的网页文本并非所有内容都能够代表POI信息的种类,即并非所有文本内容都与POI信息相关,因此传统分类方法中由于大量干扰信息的存在,使得分类准确率偏低。
发明内容
为克服上述技术问题或者至少部分地解决上述技术问题,特提出以下技术方案:
本发明的实施例提出了一种对POI信息进行分类的方法,包括:
提取待分类POI信息的名称信息;
对名称信息进行切词处理,获取多个切分片段;
将多个切分片段以预定匹配顺序与分类关键词进行匹配;
将最先匹配成功的切分片段对应的分类关键词指向的POI分类,确定为待分类POI信息的所属分类。
本发明的实施例还提出了一种对POI信息进行分类的装置,其特征在于,包括:
名称提取模块,用于提取待分类POI信息的名称信息;
切词模块,用于对名称信息进行切词处理,获取多个切分片段;
匹配模块,用于将多个切分片段以预定匹配顺序与分类关键词进行匹配;
分类确定模块,用于将最先匹配成功的切分片段对应的分类关键词指向的POI分类,确定为待分类POI信息的所属分类
本方案的实施例中,由于仅需对待分类POI信息的名称信息进行切词处理,可降低切词所需时间;随后将切词得到的切分片段进行关键词匹配,基于切词后的得到的较少切分片段,在后续进行关键字匹配时匹配次数也可相应减少,提高了POI信息分类过程的运行时间;同时,由于名称信息与POI信息具有高相关性,使得基于名称信息确定的分类准确性较高,从整体上提高了POI信息分类的效率。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明中对POI信息进行分类的方法一个实施例的流程图;
图2为本发明中对POI信息进行分类的装置一个实施例的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510379990.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种提前书写式英语教学用具
- 下一篇:一种带有吸水垫的多功能笔
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置