[发明专利]基于行业分类的检索方法、检索装置及可读存储介质在审
申请号: | 201910806758.7 | 申请日: | 2019-08-27 |
公开(公告)号: | CN110619067A | 公开(公告)日: | 2019-12-27 |
发明(设计)人: | 许赵云;许明峰;胡新平;陈明忠;毛瑞彬;赵剑;宋娜;李爱文 | 申请(专利权)人: | 深圳证券交易所 |
主分类号: | G06F16/9035 | 分类号: | G06F16/9035;G06F16/906 |
代理公司: | 44287 深圳市世纪恒程知识产权代理事务所 | 代理人: | 黄嗣童 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 行业分类 预设 可读存储介质 检索 公司信息 检索装置 关键词更新 检索关键词 检索请求 检索数据 关联 分类 更新 | ||
1.一种基于行业分类的检索方法,其特征在于,所述基于行业分类的检索方法,包括:
获取与行业分类相关的行业分类文件;
对所述行业分类文件的内容进行共现处理得到共现关键词;
根据所述共现关键词更新预设行业分类词;
根据更新后的所述预设行业分类词对关联的公司信息重新分类,其中,在接收到检索请求后,根据检索关键词对应的预设行业分类词获取对应的公司信息。
2.如权利要求1所述的基于行业分类的检索方法,其特征在于,所述对所述行业分类文件的内容进行共现处理得到共现关键词的步骤,包括:
对所述行业分类文件进行聚类处理得到至少一个文件组;
对所述文件组内的行业分类文件的内容进行共现处理得到所述文件组对应的共现关键词。
3.如权利要求2所述的基于行业分类的检索方法,其特征在于,所述对所述行业分类文件进行聚类处理得到至少一个文件组的步骤,包括:
获取各个所述行业分类文件的文件向量,并获取各个所述文件向量之间的距离;
将所述距离小于预设距离的所述文件向量对应的行业分类文件聚类为一个所述文件组。
4.如权利要求2所述的基于行业分类的检索方法,其特征在于,所述对所述文件组内的行业分类文件的内容进行共现处理得到所述文件组对应的共现关键词的步骤,包括:
提取各个所述行业分类文件的内容中的关键词;
获取各个所述关键词重复出现的次数;
将所述次数大于预设次数的关键词作为所述共现关键词。
5.如权利要求1所述的基于行业分类的检索方法,其特征在于,所述根据所述共现关键词更新所述预设行业分类词的步骤,包括:
获取所述共现关键词的词向量;
根据所述词向量与预设词向量,更新所述预设行业分类词。
6.如权利要求5所述的基于行业分类的检索方法,其特征在于,所述根据所述词向量与预设词向量,更新所述预设行业分类词的步骤,包括:
获取所述词向量与所述预设词向量的相似度;
当所述相似度大于或等于预设相似度时,采用所述词向量相关联的所述共现关键词更新所述预设行业分类词。
7.如权利要求1所述的基于行业分类的检索方法,其特征在于,所述根据所述共现关键词更新所述预设行业分类词的步骤之前,还包括:
对所述共现关键词进行筛选;
所述根据所述共现关键词更新所述预设行业分类词的步骤包括:
采用所述筛选后的所述共现关键词更新所述预设行业分类词。
8.如权利要求7所述的基于行业分类的检索方法,其特征在于,所述对所述共现关键词进行筛选的步骤,包括:
检索所述共现关键词相关联的行业数据;
当未检索到与所述共现关键词相关联的所述行业数据时,删除所述共现关键词。
9.一种基于行业分类的检索装置,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的基于行业分类的检索程序,所述基于行业分类的检索程序被所述处理器执行时实现权利要求1-8任一所述的基于行业分类的检索方法。
10.一种可读存储介质,其特征在于,其上存储有基于行业分类的检索程序,该基于行业分类的检索程序被处理器执行时实现权利要求1-8任一所述的基于行业分类的检索方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳证券交易所,未经深圳证券交易所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910806758.7/1.html,转载请声明来源钻瓜专利网。