[发明专利]一种基于循环神经网络的搜索引擎索引构建方法及装置在审
申请号: | 202111075576.0 | 申请日: | 2021-09-14 |
公开(公告)号: | CN113779032A | 公开(公告)日: | 2021-12-10 |
发明(设计)人: | 李保平 | 申请(专利权)人: | 广州汇通国信科技有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/28;G06N3/04;G06N3/08 |
代理公司: | 广州熠辉专利代理事务所(普通合伙) 44796 | 代理人: | 李恒远 |
地址: | 510700 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 循环 神经网络 搜索引擎 索引 构建 方法 装置 | ||
本发明公开了一种基于循环神经网络的搜索引擎索引构建方法及装置,涉及搜索引擎索引构建技术领域,针对现有的基于循环神经网络的搜索引擎索引构建方法及装置存在的自适应能力弱,对数据的挖掘精确度低,稳定性和可靠性差的问题,现提出如下方案,所述基于循环神经网络的搜索引擎索引构建方法包括如下步骤:S1、索引获取:获取用户输入的索引内容;S2、索引解析:根据索引内容匹配解析器,并对用户输入的索引内容进行解析;S3、信息搜索:提炼索引关键词,结合关键词基于循环神经网络进行信息搜索。本发明自适应能力强,索引性能强,便于对索引数据进行精确挖掘,稳定性和可靠性高。
技术领域
本发明涉及搜索引擎索引构建技术领域,尤其涉及一种基于循环神经网络的搜索引擎索引构建方法及装置。
背景技术
循环神经网络是随着时间的推移,重复发生的结构,搜索引擎索引是指自动收集信息,经过处理后,将提供给用户对信息进行查询的系统,搜索引擎索引的精确度基于搜索引擎索引的构建,现有的搜索引擎索引的构建方法和构建装置,使实际使用过程中仍存在不足,自适应能力弱,对数据的挖掘精确度低,稳定性和可靠性差,因此,为了解决此类问题,我们提出了一种基于循环神经网络的搜索引擎索引构建方法及装置。
发明内容
本发明提出的一种基于循环神经网络的搜索引擎索引构建方法及装置,解决了现有的基于循环神经网络的搜索引擎索引构建方法及装置存在的自适应能力弱,对数据的挖掘精确度低,稳定性和可靠性差的问题。
为了实现上述目的,本发明采用了如下技术方案:
一种基于循环神经网络的搜索引擎索引构建方法,所述基于循环神经网络的搜索引擎索引构建方法包括如下步骤:
S1、索引获取:获取用户输入的索引内容;
S2、索引解析:根据索引内容匹配解析器,并对用户输入的索引内容进行解析;
S3、信息搜索:提炼索引关键词,结合关键词基于循环神经网络进行信息搜索;
S4、信息索引:对搜索到的信息进行理解和索引,并从中抽取出索引项,生成索引列表;
S5、索引反馈:从索引列表中根据索引相关度进行排序,并对索引结果进行回传。
所述步骤S1索引获取所涉及的获取用户输入的索引内容,其索引内容包括但不限于字、词、短语、文章、图片和链接。
所述步骤S2索引解析所涉及的根据索引内容匹配解析器,并对用户输入的索引内容进行解析,其解析器包括但不限于SQL SERVER、MYSQL和ORACLE,在实际操作过程中根据用户输入的需要进行索引的内容进行匹配,匹配后对其进行解析。
所述步骤S3信息搜索所涉及的提炼索引关键词,结合关键词基于循环神经网络进行信息搜索,其在循环神经网络中进行漫游,发现和搜集需要进行索引的相关信息,且在对信息进行搜索之前,还包括构建循环神经网络,所述循环神经网络的构建方法如下步骤:
S31、汇集待创建的循环神经网络所属范围内的全部数据;
S32、对汇集的数据进行概念词提取,以及对提取的概念词进行汇集;
S33、建立概念词与数据的主体关系;
S34、对概念词与数据的关系进行验证和调整。
所述步骤S4信息索引所涉及的对搜索到的信息进行理解和索引,并从中抽取出索引项,生成索引列表,其理解步骤S3信息搜索所搜索到的信息,从中抽取出索引项,用于表示文档以及生成文档库的索引表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州汇通国信科技有限公司,未经广州汇通国信科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111075576.0/2.html,转载请声明来源钻瓜专利网。