[发明专利]检索过程中生成提示词的方法及其装置在审
申请号: | 201611196851.3 | 申请日: | 2016-12-22 |
公开(公告)号: | CN108228661A | 公开(公告)日: | 2018-06-29 |
发明(设计)人: | 曲德君;李进岭;曹大军;杨冠军;李海亮;林寿怡 | 申请(专利权)人: | 上海新飞凡电子商务有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京尚德技研知识产权代理事务所(普通合伙) 11378 | 代理人: | 徐乐慧;陈保胜 |
地址: | 200120 上海市浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 查询信息 提示 查询条件 检索过程 权重 数据库 大小写转换 分析处理 信息确定 转换规则 检索词 转换 排序 存储 | ||
本发明公开了一种检索过程中生成提示词的方法,至少包括以下步骤:获取用户输入的查询信息,对所述的查询信息进行繁简以及大小写转换的初始处理;分析处理初始处理后的查询信息,识别查询信息的格式,并按照存储设定的转换规则进行转换;根据数据库中的信息确定转换后的查询信息中的检索词的权重,并根据权重做出排序生成查询条件;根据数据库中的设定规则以及生成的查询条件生成提示词。另外本发明还公开一种使用该方法的生成提示词的装置。
技术领域
本发明涉及数据的处理技术领域,尤其涉及一种检索过程中生成提示词的方法及其装置。
背景技术
随着大数据时代的到来,人们可以通过网络获得更多的信息,而查找需要的信息的准确性就变得尤为重要,因此作为查找信息的重要技术检索技术就使用的愈加广泛,而用户对检索技术的要求也越来越高。现有的检索技术通常都采用关键词进行查找,一般采用基于trie树的前缀树查找方式,采用此查找方式需要存储trie树结构,每个词都需要存储它所有的查询路径,因此比较浪费存储空间,在进行查找的时候需要由根节点开始搜索,获得要查找的关键词的首字母,并选择该字母对应的子树并在子树种急需进行检索,在相应的子树上,获得要查找的第二个字母,并进一步对所选的子树进行检索,再进行迭代过程,在某节点处,会实现关键词上所有的字母均被去除,这读取该点的信心,完成检索过程。但是采用这种方式,对于中文加拼音的混合数据方式,检索的效率以及准确度都有所下降。
在以下几件专利申请中均给出了改进的检索方式,如CN201510149146.7,CN201510662545.3,CN201510155921.X以及CN201310512424.1,分别给出了不同的检索方法,但上述几项申请,依然没有明确解决中文加拼音混合输入的方式存在的检索结果不准确的问题。
发明内容
本发明目的是提供一种检索过程中的生成提示词的方法及其装置,解决中文加拼音混合输入检索不准确的问题。
本发明解决技术问题采用如下技术方案:
一种检索过程中生成提示词的方法,其特征在于,至少包括以下步骤:
获取用户输入的查询信息,对所述的查询信息进行繁简以及大小写转换的初始处理;
分析处理初始处理后的查询信息,识别查询信息的格式,并按照存储设定的转换规则进行转换;
根据数据库中的信息确定转换后的查询信息中的检索词的权重,并根据权重做出排序生成查询条件;
根据数据库中的设定规则以及生成的查询条件生成提示词。
其中,所述查询信息的格式至少包括以下三种:中文+非中文,中文,非中文。
其中,所述的转换规则包括:将非中文转换为其他字符,首先理解识别中文字符。
其中,还进一步包括,用户对生成的提示词进行选择,获得检索结果的步骤。
本发明还公开一种检索过程中生成提示词的装置,至少包括:
数据库单元,用于存储设定的转换规则以及关键词及其权重信息;
查询信息获取单元,用于接收用户输入的查询信息;
初始处理单元,用于接收所述查询信息获取单元发送的信息进行繁简以及大小写转换的初始处理;
查询信息分析单元,用于根据数据库的存储的信息对所述的初始处理单元传递的信息进行查询信息的格式识别以及转换;
查询条件生成单元,用于根据数据库的内容以及查询信息分析单元传递的信息生成查询条件;
提示词生成单元,用于根据所述查询条件生成单元生成的查询条件生成提示词。
其中,还进一步包括,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海新飞凡电子商务有限公司,未经上海新飞凡电子商务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611196851.3/2.html,转载请声明来源钻瓜专利网。