[发明专利]一种融合知识信息的领域专利质量等级预测方法在审
申请号: | 202210972465.8 | 申请日: | 2022-08-17 |
公开(公告)号: | CN115204519A | 公开(公告)日: | 2022-10-18 |
发明(设计)人: | 吕学强;游新冬;董志安;滕尚志 | 申请(专利权)人: | 北京信息科技大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/06;G06F16/35;G06F16/951;G06K9/62;G06N3/04;G06N3/08;G06N20/10 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100192 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 知识 信息 领域 专利 质量 等级 预测 方法 | ||
1.本发明的一种融合知识信息的领域专利质量等级预测方法,其特征在于,包括以下步骤:
(一)、获取实验所需数据,主要对专利摘要中涉及功效短语的句子进行筛选,通过训练得到融合多特征(偏旁部首、五笔、词长、词性)的抽取模型,用于专利文本中功效词的识别;
(二)、针对专利标题与专利摘要中的主题词通过自构建的词库进行一轮标注,后进行多轮人工校对,基于Albert-BiLSTM模型进行训练得到抽取模型,用于专利文本中技术主题的抽取;
(三)、将抽取出的主题词和功效短语利用K-means算法进行聚类,并经过进一步的人工审查和补充,最终根据专利文本构建技术功效矩阵,矩阵中新能源专利领域内的规模大小将用于后续对该领域专利质量的等级评估;
(四)、利用已经相对成熟的美国专利质量评估模型,将美国专利翻译成中文进行训练,并利用少数具有质量标签的中文专利文本完成对模型的微调,同时将长文本与数字指标分别量化和组合后划分为132个指标,训练得到迁移学习模型;
(五)、将知识信息(技术功效矩阵)作为一种新的维度指标并与其他132个指标相结合用以专利质量评级,即将所有指标向量化或归一化后进行向量的拼接,并在效果较好的基于迁移学习的模型的基础上进行预测模型的训练,在测试集上进行专利质量等级的预测。
2.如权利要求1所述的一种融合知识信息的领域专利质量等级预测方法,其特征在于:通过对专利文本中包含的功效短语特征进行分析,总结了功效短语在字形结构、字音、词性色彩、词根、语义关系、词长等方面存在的特征关系,并将其归纳提炼为偏旁部首特征、五笔编码特征、词性特征和词长,融合多特征进行功效短语的抽取,为后续构建技术功效矩阵奠定了基础。
3.如权利要求2所述的一种融合知识信息的领域专利质量等级预测方法,其特征在于:针对主题词抽取模型参数量大训练速度慢的问题,利用Albert预训练对专利文本进行向量化,在提高模型准确率的同时,使用最少的参数最大程度上提升了模型的各项性能,能够在抽取任务上进行更为实际广泛的应用,为后续技术功效矩阵的构建奠定了基础。
4.如权利要求3所述的一种融合知识信息的领域专利质量等级预测方法,其特征在于:以技术主题词作为横坐标,功效短语作为纵坐标构建技术功效矩阵,根据技术功效矩阵中的相关数据可以分析技术集聚点和空白点,集聚点就是目前的热门领域,空白点可能就是未来技术创新的方向,由此通过将知识信息维度引入专利质量评估指标以提升专利质量等级预测效果。
5.如权利要求4所述的一种融合知识信息的领域专利质量等级预测方法,其特征在于:基于美国专利质量评估已经发展相对成熟,由此利用迁移学习以提升中国专利质量评估效果,同时将长文本与数字量化指标相结合,进一步提取到专利数据中的相关特征。
6.如权利要求5所述的一种融合知识信息的领域专利质量等级预测方法,其特征在于:在专利质量评估工作中增加一项新的特征维度,即知识信息维度(技术功效矩阵),从专利技术规模及功能效用的角度出发对专利质量的等级进行判断,并基于迁移学习的模型训练得质量等级预测模型,最终预测效果取得明显提升。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京信息科技大学,未经北京信息科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210972465.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:电子设备
- 下一篇:资源分配方法、系统、装置、设备及存储介质
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置