[发明专利]一种基于文本语义分析需求与输出成果之间匹配度的方法在审
| 申请号: | 202010220922.9 | 申请日: | 2020-03-26 |
| 公开(公告)号: | CN111309871A | 公开(公告)日: | 2020-06-19 |
| 发明(设计)人: | 李洁茹;刘同新;徐剑;张若兴 | 申请(专利权)人: | 普华讯光(北京)科技有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/36;G06N3/04 |
| 代理公司: | 北京润捷智诚知识产权代理事务所(普通合伙) 11831 | 代理人: | 孙巍 |
| 地址: | 100070 北京市丰台区南四*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 文本 语义 分析 需求 输出 成果 之间 匹配 方法 | ||
本发明公开了一种基于文本语义分析需求与输出成果之间匹配度的方法,包括以下步骤:步骤1.数据集标注;步骤2.技术文档预处理;步骤3.单参数模型训练及预测;步骤4.多参数模型预测结果集成;本发明的有益效果:首次将深度学习与NLP技术应用于企业项目管理的项目关联度计算领域,根据项目需求及成果描述计算两个项目之间的关联匹配度,有效降低了关联项目定位的难度,同时也可以帮助需求方快速、高效地定位适配自己需求的优质项目,大幅度缩减用于成果筛选匹配方面的时间及资源投入,凭借已有项目成果技术文档与项目申报指南的文本数据计算项目之间的关联匹配程度,进而辅助大型企业在项目招投标环节中筛选高匹配度的优质项目。
技术领域:
本发明属于不限定行业的项目需求与成果匹配度计算领域,特别涉及一种基于文本语义分析需求与输出成果之间匹配度的方法。
背景技术:
项目关联度计算是企业项目管理的重要环节之一,尤其像电网这种已有项目成果众多且每年项目申报数巨大的国有企业。如何在已有预研项目与科技项目申报指南中的待申报项目之间进行关联度计算,理清项目之间的匹配关系,依据申报指南中特定研究课题检索出众多预研项目中最符合需求的项目进行招投标,有效避免研究需求与预研项目的研究方向不一致、研究目的不统一问题,降低各子公司与总公司在项目申报环节中的各种出入,保证总公司的研究需求能够直接、有效地落实到各个研究单位并付诸研究,实现既定的科研要求并应用于企业发展。如果不能有效地计算申报指南与预研项目之间地匹配关系,则需要在申报前人工判定二者关系,确定是否满足申报要求,这在电网这种大型国有企业无疑是一种巨大的资源消耗;同时,人工判定受限于当事人从业经历、专业知识的限制,容易出现项目关系认定不清晰,研究目的不统一的问题。因此,站在企业项目管理的角度,研究预研项目与待申报项目之间的匹配关系是电网科研项目申报中面临的首要任务。
目前,有关项目间关联匹配度计算的研究还比较少,这主要是因为:第一、科研项目一般涉及高新技术、专业领域知识比较多,科研项目间关联度计算对研究者专业知识具有较高要求;第二、科研项目研究周期普遍较长且内容庞杂,如何从一个独特的研究视角进行切入一直是困扰相关研究者的重要问题;第三、对于科研项目关联度计算的研究必须要求某垂直领域的大量项目资料信息,这对于一般企业的项目资料拥有量是一个巨大考验。
发明内容:
本发明的目的就在于为了解决上述问题而提供一种基于文本语义分析需求与输出成果之间匹配度的方法,解决了目前现有的问题。
为了解决上述问题,本发明提供了一种技术方案:
一种基于文本语义分析需求与输出成果之间匹配度的方法,包括以下步骤:
步骤1.数据集标注:使用基于项目需求描述、成果描述及项目标题的文本信息,对比总结两个项目的关联匹配程度并进行四分类标注,构造用于项目匹配度计算建模的标注数据集;
步骤2.技术文档预处理:构造Bert模型输入文本,鉴于Bert模型输入序列长度及计算资源的限制,此处基于项目名称使用Rough-L算法以句为单位对项目的需求及成果描述文本进行核心信息提取,每一个项目的输入文本由A|B两部分构成,A为项目名称,B为项目核心信息部分;
步骤3.单参数模型训练及预测:基于知识蒸馏、交叉验证及集成学习的思想对Bert模型进行部分改进,并基于标注好的数据进行模型建模、调优及分类标签预测,完成从原始数据到单模型关联度预测结果输出的任务;
步骤4.多参数模型预测结果集成:根据改进模型中涉及到的“温度”调节参数T及交叉验证折数K的不同取值组合训练多个模型,并根据表现效果筛选质量较好的5个模型进行多模型概率集成获取最终预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于普华讯光(北京)科技有限公司,未经普华讯光(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010220922.9/2.html,转载请声明来源钻瓜专利网。





