[发明专利]提案自动识别并生成报告的方法、装置、设备和介质有效
| 申请号: | 202210450048.7 | 申请日: | 2022-04-27 |
| 公开(公告)号: | CN114547087B | 公开(公告)日: | 2022-07-26 |
| 发明(设计)人: | 刘跃华 | 申请(专利权)人: | 湖南正宇软件技术开发有限公司 |
| 主分类号: | G06F16/242 | 分类号: | G06F16/242;G06F16/2452;G06F16/2458;G06Q10/10 |
| 代理公司: | 长沙国科天河知识产权代理有限公司 43225 | 代理人: | 赵小龙 |
| 地址: | 410000 湖南省长沙市长沙高新开发区*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 提案 自动识别 生成 报告 方法 装置 设备 介质 | ||
1.提案自动识别并生成报告的方法,其特征在于,包括:
从历史提案库中提取关联统计数据的统计语义样本,设置所述统计语义样本中每个关键词的第一位置向量;所述第一位置向量用于描述所述关键词在所述统计语义样本中的第一位置信息、第一词频信息和第一权重信息;
从待识别提案中提取待识别语句,并设置待识别语句中每个识别词的第二位置向量;所述第二位置向量用于描述所述识别词在所述待识别语句中的第二位置信息、第二词频信息和第二权重信息;
将所述待识别语句和所述统计语义样本进行匹配,根据所述第一词频信息和所述第二词频信息,得到与所述识别词匹配的关键词和匹配数;根据所述识别词的第二位置信息和所述关键词的第一位置信息,计算距离差;根据所述匹配数、所述距离差、所述第一权重信息以及所述第二权重信息,得到所述待识别语句和所述统计语义样本的关联权重:
式中,W表示关联权重;i表示第i次匹配到,n表示匹配数大于零的识别词的个数,freqi表示匹配成功的识别词的匹配数,weighti表示匹配成功的识别词的第二权重,gapi表示距离差,j表示第j次未匹配到,m表示匹配数等于零的识别词的个数,freqj表示匹配失败的识别词的匹配数,weightj表示匹配失败的识别词的第二权重;
当所述关联权重的值大于预先设置的权重阈值,则将所述待识别语句并入所述统计语义样本;
根据所述统计语义样本,生成所述待识别提案的报告。
2.根据权利要求1所述的方法,其特征在于,还包括:
建立统计语义样本的关联关系;根据关联关系,将所述待识别语句和所述统计语义样本进行指标关联匹配;当匹配结果为匹配失败时,根据所述待识别语句更新统计语义样本。
3.根据权利要求2所述的方法,其特征在于,从历史提案库中提取关联统计数据的统计语义样本包括:
获取历史提案库,得到历史提案,从所述历史提案中提取统计语句以及与所述统计语句相对应的统计数据,对所述统计语句和所述统计数据做规范化处理,生成所述统计语义样本。
4.根据权利要求3所述的方法,其特征在于,每个统计语义样本均包括多个统计语句,每个统计语句均包括多个关键词。
5.根据权利要求4所述的方法,其特征在于,每个统计语句均对应一个查询语法,执行所述查询语法即可得到所述统计语句对应的具体数据。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述第一权重信息和所述第二权重信息是采用TFIDF算法计算得到的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南正宇软件技术开发有限公司,未经湖南正宇软件技术开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210450048.7/1.html,转载请声明来源钻瓜专利网。





