[发明专利]标书生成方法、装置及服务器有效
申请号: | 202111130383.0 | 申请日: | 2021-09-26 |
公开(公告)号: | CN113836906B | 公开(公告)日: | 2023-06-06 |
发明(设计)人: | 李苗苗;郝天新;桑海岩;张琳;苏建辉;孙雅琳 | 申请(专利权)人: | 中国联合网络通信集团有限公司;联通大数据有限公司 |
主分类号: | G06F40/258 | 分类号: | G06F40/258;G06F40/186;G06F18/22;G06F16/33;G06F16/35;G06F16/335 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 杨泽;刘芳 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标书 生成 方法 装置 服务器 | ||
1.一种标书生成方法,其特征在于,包括:
接收终端发送的标书生成请求,所述标书生成请求中包含待生成标书的N个目标标题、所述N个目标标题的顺序以及目标标签,其中N为正整数;
响应于所述标书生成请求,从预存标书数据库获取每个目标标题对应的若干个待选标题、以及每个待选标题对应的正文和标签,所述预存标书数据库中存储有通用标题集、非通用标题集以及标签集合;
确定每个目标标题与对应的所有待选标题与之间的相似度,并对获得的所有相似度进行排序,获得所述目标标题对应的有序待选标题集合,由此获得所有目标标题的有序待选标题集合,根据预存标书数据库中的通用标题集、非通用标题集、标签集合以及目标标签对每个待选标题进行筛选,并根据每个待选标题的相似度确定每个目标标题的正文;
将所有目标标题的正文按照N个目标标题的顺序生成标书,并将生成后的标书发送至所述终端。
2.根据权利要求1所述的方法,其特征在于,所述预存标书数据库的获得过程,包括:
对数据库中存储的所有标书进行数据清洗,获得所有标书的关键内容,并对所述所有标书的关键内容进行结构化处理,获得M个标题以及每个标题对应的正文和标签,M为正整数;
根据类别数对所述M个标题进行文本聚类,其中所述类别数为预设关键字属性集合的个数,所述预设关键字属性集合包含标签关键词和标书关键字;
接收终端发送的X个同类别标题集合,以及每个同类别标题集合对应的标签集合,将包含的标题数量大于或者等于预设阈值的同类别标题集合设定为通用标题集合,并将所述通用标题集合中包含的所有标题设定为通用标题,将包含的标题数量小于预设阈值的同类别标题集合设定为非通用标题集合,并将所述非通用标题集合中包含的所有标题设定为非通用标题,X为正整数;
根据同类别标题集合对应的标签集合确定所有通用标题的标签,并根据同类别标题集合对应的标签集合确定所有非通用标题的标签,将所有通用标题、每个通用标题对应的正文以及标签进行存储,以及将所有非通用标题、每个非通用标题对应的正文以及标签进行存储获得预存标书数据库。
3.根据权利要求1所述的方法,其特征在于,所述根据预存标书数据库中的通用标题集、非通用标题集、标签集合以及目标标签对每个待选标题进行筛选,并根据每个待选标题的相似度确定每个目标标题的正文,包括:
当所述待选标题为通用标题且所述待选标题是没有标签的,若相似度大于第一预设阈值时,则将所述待选标题作为所述目标标题的选定标题;
对所述目标标题对应的所有选定标题的正文进行融合处理,获得所述目标标题对应的正文。
4.根据权利要求1所述的方法,其特征在于,所述根据预存标书数据库中的通用标题集、非通用标题集、标签集合以及目标标签对每个待选标题进行筛选,并根据每个待选标题的相似度确定每个目标标题的正文,包括:
当所述待选标题为通用标题且所述待选标题带有标签,相似度大于第二预设阈值时,则将所述待选标题作为所述目标标题的暂定标题;
计算所述目标标题对应的所有暂定标题对应的标签与目标标签之间的相似度,根据所有暂定标题的相似度进行排序获得第一有序选定标题集合,并根据所述第一有序选定标题集合中所有待选标题对应的正文,对所述目标标题对应的所有待选标题的正文进行融合处理。
5.根据权利要求1所述的方法,其特征在于,所述根据预存标书数据库中的通用标题集、非通用标题集、标签集合以及目标标签对每个待选标题进行筛选,并根据每个待选标题的相似度确定每个目标标题的正文,包括:
若所述待选标题为非通用标题且所述待选标题的相似度大于第三预设阈值时,计算每个待选标题与每个目标标题之间的字面相似度,并将每个待选标题的字面相似度和语义相似度按照权重进行融合,确定每个待选标题的融合相似度;
将所述融合相似度大于第四预设阈值的所有待选标题作为第二选定标题集合,并将所述第二选定标题集合中的所有待选标题按照融合相似度进行排序获得第二有序选定标题集合,并根据所述第二有序选定标题集合中最优待选标题对应的正文、按顺序生成所述目标标题对应的正文,其中所述最优待选标题为所有待选标题中的第一顺位标题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国联合网络通信集团有限公司;联通大数据有限公司,未经中国联合网络通信集团有限公司;联通大数据有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111130383.0/1.html,转载请声明来源钻瓜专利网。