[发明专利]一种基于Elasticsearch的公文检索方法及装置在审
申请号: | 202310031390.8 | 申请日: | 2023-01-10 |
公开(公告)号: | CN116383375A | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 周嫣然;刘学谦;马延美 | 申请(专利权)人: | 北京方寸无忧科技发展有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/258;G06F40/30;G06F16/33;G06F16/31;G06F40/289;G06F18/214;G06F18/241 |
代理公司: | 北京博智永信知识产权代理事务所(普通合伙) 16169 | 代理人: | 王子溟 |
地址: | 100091 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 elasticsearch 公文 检索 方法 装置 | ||
1.一种基于Elasticsearch的公文检索方法,其特征在于,所述基于Elasticsearch的公文检索方法包括:
获取公文数据;
获取每个公文数据的文字信息;
根据文字信息对各个公文数据进行分类,从而为每个公文数据提供分类标签,其中,每个公文数据至少具有一个子母标签,一个子母标签包括一个母标签以及至少一个从属于该母标签的子标签;
根据分类后的结果将获取的公文数据分别进行存储,从而形成至少两个Elasticsearch数据库;
获取待检索信息;
根据待检索信息,自各个所述Elasticsearch数据库中的一个或多个Elasticsearch数据库进行检索,从而获取符合条件的公文数据。
2.根据权利要求1所述的基于Elasticsearch的公文检索方法,其特征在于,所述根据文字信息对各个公文数据进行分类,从而为每个公文数据提供分类标签,其中,每个公文数据至少具有一个子母标签,一个子母标签包括一个母标签以及至少一个从属于该母标签的子标签包括:
抽取标题的关键词;
获取第一关键词分类数据库,所述第一关键词分类数据库包括至少一个第一关键词、子标签以及母标签,一个子标签对应至少一个第一关键词,一个母标签与至少一个子标签对应;
判断抽取的关键词是否与一个所述第一关键词相同,若是,则
获取与抽取的关键词相同的第一关键词所对应的子标签以及该子标签所对应的母标签。
3.根据权利要求2所述的基于Elasticsearch的公文检索方法,其特征在于,所述根据文字信息对各个公文数据进行分类,从而为每个公文数据提供分类标签,其中,每个公文数据至少具有一个子母标签,一个子母标签包括一个母标签以及至少一个从属于该母标签的子标签进一步包括:
抽取每个公文数据的正文的关键词;
获取第一正文关键词分类数据库,所述第一正文关键词分类数据库包括至少一个第一正文关键词、子标签以及母标签,一个子标签对应至少一个第一正文关键词,一个母标签与至少一个子标签对应;
判断抽取的正文的关键词是否与一个所述第一正文关键词相同,若是,则
获取与抽取的正文的关键词相同的第一正文关键词所对应的子标签以及该子标签所对应的母标签。
4.如权利要求3所述的基于Elasticsearch的公文检索方法,其特征在于,所述根据文字信息对各个公文数据进行分类,从而为每个公文数据提供分类标签,其中,每个公文数据至少具有一个子母标签,一个子母标签包括一个母标签以及至少一个从属于该母标签的子标签进一步包括:
获取经过训练的分类模型;
提取所述公文数据的特征;
将所述公文数据的特征输入至所述分类模型,从而获取分类模型所输出的子标签,并根据所述子标签获取所述子标签对应的母标签。
5.如权利要求4所述的基于Elasticsearch的公文检索方法,其特征在于,所述根据分类后的结果将获取的公文数据分别进行存储,从而形成至少两个Elasticsearch数据库包括:
获取各个经过分类的公文数据的来案时间以及公文数据引用频率;
根据各个经过分类的公文数据的来案时间以及公文数据引用频率将各个公文数据分别放入不同的Elasticsearch数据库。
6.如权利要求5所述的基于Elasticsearch的公文检索方法,其特征在于,在所述根据待检索信息,自各个所述Elasticsearch数据库中的一个或多个Elasticsearch数据库进行检索,从而获取符合条件的公文数据之前,所述基于Elasticsearch的公文检索方法进一步包括:
识别所述待检索信息中的文字信息;
通过中文纠错模型对所述文字信息进行纠错。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京方寸无忧科技发展有限公司,未经北京方寸无忧科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310031390.8/1.html,转载请声明来源钻瓜专利网。