[发明专利]一种统计数据的查询方法、装置、电子设备及存储介质在审
申请号: | 202010188145.4 | 申请日: | 2020-03-17 |
公开(公告)号: | CN111400253A | 公开(公告)日: | 2020-07-10 |
发明(设计)人: | 王卓飞;白欢朋;蒋兴荣;曾曲 | 申请(专利权)人: | 北京华通人商用信息有限公司 |
主分类号: | G06F16/14 | 分类号: | G06F16/14 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 谢玲 |
地址: | 100000 北京市丰台区南四环*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 统计数据 查询 方法 装置 电子设备 存储 介质 | ||
本申请提供了一种统计数据的查询方法、装置、电子设备及存储介质,其中,该方法包括:接收用户端输入的查询信息;将查询信息划分为至少一个查询词条;针对每个查询词条,从预设的词条索引库中查找与该查询词条对应的词条索引文件;基于查找到的词条索引文件确定该查询词条与该查询词条所属的至少一个原始统计数据之间的匹配关系;基于每个查询词条与该查询词条所属的至少一个原始统计数据之间的匹配关系,确定查询信息与各个原始统计数据之间的匹配度;根据确定的匹配度从各个原始统计数据中选取目标统计数据,并返回至用户端。采用上述方案,能够实现统计数据高效且针对性的查询。
技术领域
本申请涉及数据处理技术领域,具体而言,涉及一种统计数据的查询方法、装置、电子设备及存储介质。
背景技术
统计数据作为一种表示地理区域自然经济要素特征、规模、结构、水平等指标的数据,可以为城市或地区管理过程中的各种分析和决策提供数据支持。
其中,上述统计数据不仅可以包括统计指标及其对应的指标值,还可以涵盖有地区、时间等相关信息,如全国国内生产总值(Gross Domestic Product,GDP)的同比增长率为3.8、河南省2018年度的GDP为4.81万亿元等。
可知,统计数据的表现形式较为复杂,除此之外,还存在各种类型的统计数据。如何从大量种类丰富的统计数据中查询得到用户所需的数据成为当下需要解决的问题。
发明内容
有鉴于此,本申请的目的在于提供一种统计数据的查询方法、装置、电子设备及存储介质,以实现统计数据高效且针对性的查询。
第一方面,本申请提供了一种统计数据的查询方法,所述方法包括:
接收用户端输入的查询信息;
将所述查询信息划分为至少一个查询词条;
针对每个查询词条,从预设的词条索引库中查找与该查询词条对应的词条索引文件;基于查找到的词条索引文件确定该查询词条与该查询词条所属的至少一个原始统计数据之间的匹配关系;
基于每个查询词条与该查询词条所属的至少一个原始统计数据之间的匹配关系,确定所述查询信息与各个原始统计数据之间的匹配度;
根据确定的匹配度从各个原始统计数据中选取目标统计数据,并返回至所述用户端。
在一种实施方式中,按照以下步骤生成所述词条索引库:
获取各个原始统计数据;
针对每个原始统计数据,将该原始统计数据划分为至少一个统计词条;
基于每个原始统计数据划分后的至少一个统计词条,确定统计词条组;
针对统计词条组中的每个统计词条,确定该统计词条所属的至少一个原始统计数据;建立该统计词条与该统计词条所属的至少一个原始统计数据之间的匹配关系;基于建立的所述匹配关系确定与该统计词条对应的词条索引文件;
将统计词条组中的各个统计词条对应的词条索引文件进行组合,存储至预设的词条索引库。
在一种实施方式中,所述基于建立的所述匹配关系确定与该统计词条对应的词条索引文件,包括:
针对统计词条组中的每个统计词条,基于建立的所述匹配关系确定该统计词条与每个原始统计数据之间的匹配值;按照原始统计数据的预设排列顺序将各个匹配值进行合并,得到与该统计词条对应的匹配向量;
根据统计词条组中的每个统计词条对应的匹配向量,生成与该统计词条对应的词条索引文件。
在一种实施方式中,所述基于建立的所述匹配关系确定该统计词条与每个原始统计数据之间的匹配值,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京华通人商用信息有限公司,未经北京华通人商用信息有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010188145.4/2.html,转载请声明来源钻瓜专利网。