[发明专利]提案自动识别并生成报告的方法、装置、设备和介质有效
| 申请号: | 202210450048.7 | 申请日: | 2022-04-27 |
| 公开(公告)号: | CN114547087B | 公开(公告)日: | 2022-07-26 |
| 发明(设计)人: | 刘跃华 | 申请(专利权)人: | 湖南正宇软件技术开发有限公司 |
| 主分类号: | G06F16/242 | 分类号: | G06F16/242;G06F16/2452;G06F16/2458;G06Q10/10 |
| 代理公司: | 长沙国科天河知识产权代理有限公司 43225 | 代理人: | 赵小龙 |
| 地址: | 410000 湖南省长沙市长沙高新开发区*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 提案 自动识别 生成 报告 方法 装置 设备 介质 | ||
本申请涉及提案自动识别并生成报告的方法、装置、设备和介质。方法包括:提取统计语义样本,设置统计语义样本中每个关键词的第一位置向量;第一位置向量用于描述关键词在统计语义样本中的第一位置信息、第一词频信息和第一权重信息;从待识别提案中提取待识别语句,并设置待识别语句中每个识别词的第二位置向量;第二位置向量用于描述识别词在待识别语句中的第二位置信息、第二词频信息和第二权重信息;将待识别语句和统计语义样本进行匹配,得到关联权重;当关联权重的值大于预先设置的权重阈值,则将待识别语句并入统计语义样本;根据统计语义样本,生成待识别提案的报告。采用本方法能够自动识别并生成报告。
技术领域
本申请涉及计算机技术领域,特别是涉及提案自动识别并生成报告的方法、装置、设备和介质。
背景技术
随着计算机技术的发展,传统人工作业逐渐被计算机替代,在各类会议开展时,会议参与者一般而言会提交大量的提案,为了提高会议的进展,需要对所提交的提案进行分析,生成报告。
传统技术中,自动生成统计报告都需要事先预定义统计模板,统计指标固定,后台根据固定的统计指标自动填充数据。但是,一旦提案的文字内容与统计指标发生变化,就需要重新生成代码,无法高效实时生成报告。
发明内容
基于此,有必要针对上述技术问题,提供一种提案自动识别并生成报告的方法、装置、设备和介质,能够自动识别并生成报告。
提案自动识别并生成报告的方法,包括:
从历史提案库中提取关联统计数据的统计语义样本,设置所述统计语义样本中每个关键词的第一位置向量;所述第一位置向量用于描述所述关键词在所述统计语义样本中的第一位置信息、第一词频信息和第一权重信息;
从待识别提案中提取待识别语句,并设置待识别语句中每个识别词的第二位置向量;所述第二位置向量用于描述所述识别词在所述待识别语句中的第二位置信息、第二词频信息和第二权重信息;
将所述待识别语句和所述统计语义样本进行匹配,根据所述第一词频信息和所述第二词频信息,得到与所述识别词匹配的关键词和匹配数;根据所述识别词的第二位置信息和所述关键词的第一位置信息,计算距离差;根据所述匹配数、所述距离差、所述第一权重信息以及所述第二权重信息,得到所述待识别语句和所述统计语义样本的关联权重;
当所述关联权重的值大于预先设置的权重阈值,则将所述待识别语句并入所述统计语义样本;
根据所述统计语义样本,生成所述待识别提案的报告。
在其中一个实施例中,还包括:
建立统计语义样本的关联关系;根据关联关系,将所述待识别语句和所述统计语义样本进行指标关联匹配;当匹配结果为匹配失败时,根据所述待识别语句更新统计语义样本。
在其中一个实施例中,从历史提案库中提取关联统计数据的统计语义样本包括:
获取历史提案库,得到历史提案,从所述历史提案中提取统计语句以及与所述统计语句相对应的统计数据,对所述统计语句和所述统计数据做规范化处理,生成所述统计语义样本。
在其中一个实施例中,每个统计语义样本均包括多个统计语句,每个统计语句均包括多个关键词。
在其中一个实施例中,每个统计语句均对应一个查询语法,执行所述查询语法即可得到所述统计语句对应的具体数据。
在其中一个实施例中,所述第一权重信息和所述第二权重信息是采用TFIDF算法计算得到的。
提案自动识别并生成报告的装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南正宇软件技术开发有限公司,未经湖南正宇软件技术开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210450048.7/2.html,转载请声明来源钻瓜专利网。





