[发明专利]一种融合知识信息的领域专利质量等级预测方法在审

专利信息
申请号: 202210972465.8 申请日: 2022-08-17
公开(公告)号: CN115204519A 公开(公告)日: 2022-10-18
发明(设计)人: 吕学强;游新冬;董志安;滕尚志 申请(专利权)人: 北京信息科技大学
主分类号: G06Q10/04 分类号: G06Q10/04;G06Q10/06;G06F16/35;G06F16/951;G06K9/62;G06N3/04;G06N3/08;G06N20/10
代理公司: 暂无信息 代理人: 暂无信息
地址: 100192 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 融合 知识 信息 领域 专利 质量 等级 预测 方法
【说明书】:

本发明涉及自然语言处理领域的专利质量等级预测研究,其主要步骤如下:1.利用融合多特征的功效词抽取模型对功效短语进行识别;2.基于Albert‑BiLSTM模型对专利文本中包含的主题词进行抽取;3.将抽取完成的功效短语与主题词用K‑means算法进行聚类,人工构建技术功效矩阵,得到相应的技术功效与技术规模;4.将专利中包含的结构化数字信息单独量化或组合,结合长文本得到132个评价指标,并利用美国专利数据训练一个迁移学习模型,同时利用主动学习技术进行中文数据集的扩充;5.将技术功效矩阵与132个指标相结合进行迁移训练并更新参数,得到最终的预测模型。本发明有效提升了专利质量评估的准确性。

技术领域

本发明涉及自然语言处理领域的专利质量等级预测研究,特别涉及针对专利主题词与功效短语抽取及技术功效矩阵的构建方法。

背景技术

一项专利包含专利标题、摘要、权利说明书等内容,早期对于专利质量多基于技术、法律、经济等单维度指标进行评估。然而,单一的仅从某一维度难以全方面的判断一项专利的质量高低,因此,相关专家学者提出的评估指标开始将上述三个维度进行组合衍生出更多的评价指标。目前,国内外对于专利质量的评价指标仍然没有一个明确的界定,但可以肯定的是多维度多层次多指标对专利质量进行评估是能够更全面准确地对专利文本进行分析的。因此,相关研究也不再仅限于三个维度,逐渐开始趋于更多维度化,包括战略价值、专利活动、需求水平、股票价值和转化率等。随着研究的不断深入,越来越多的专家不再局限于数量指标,而是将其与专利文本内容相结合。由此可见,关键指标的组合与选取逐渐多维度化,质量评估的标准呈现多元化,如何更为精准的发掘影响质量评估结果的指标成为日后需要深入研究的热点内容。

事实上,专利质量等级的评估预测指标及相关数据的量化具有一定难度,一般难以获取,评估工作很大程度上会偏重于依赖人工统计和相关领域专家主观预测二者相结合的方式进行,这就决定了专利质量等级预测的结果具有极大的主观性和不确定性,基于不同专家各自角度的判断,其结果也可能存在一定偏差。随着技术的迅速创新及发展不难发现,利用机器学习可以利用模型自主的学习到专利文本中蕴含的特征。目前融合机器学习用于专利质量评估的方法主要有层次分析法、模糊综合评价法、逻辑回归法和决策树法等。近年来,利用神经网络及深度学习中的技术,迁移学习、主动学习等方法也逐步应用于专利等级的预测任务,其预测效果获得一定提升的同时曾存在着较大的提升空间。

发明内容

为解决上述技术问题,本发明的目的是基于现有维度和利用深度学习及迁移学习技术的基础上,提出一种融合知识信息的领域专利质量等级预测方法。

本发明的一种融合知识信息的领域专利质量等级预测方法,包括以下步骤:

1、获取实验所需数据,主要对专利摘要中涉及功效短语的句子进行筛选,通过训练得到融合多特征(偏旁部首、五笔、词长、词性)的抽取模型,用于专利文本中功效词的识别。

2、针对专利标题与专利摘要中的主题词通过自构建的词库进行一轮标注,后进行多轮人工校对,基于Albert-BiLSTM模型进行训练得到抽取模型,用于专利文本中技术主题的抽取。

3、将抽取出的主题词和功效短语利用K-means算法进行聚类,并经过进一步的人工审查和补充,最终根据专利文本构建技术功效矩阵,矩阵中新能源专利领域内的规模大小将用于后续对该领域专利质量的等级评估。

4、利用已经相对成熟的美国专利质量评估模型,将美国专利翻译成中文进行训练,并利用少数具有质量标签的中文专利文本完成对模型的微调,同时将长文本与数字指标分别量化和组合后划分为132个指标,训练得到迁移学习模型。

5、将知识信息(技术功效矩阵)作为一种新的维度指标并与其他132个指标相结合用以专利质量评级,即将所有指标向量化或归一化后进行向量的拼接,并在效果较好的基于迁移学习的模型的基础上进行预测模型的训练,在测试集上进行专利质量等级的预测。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京信息科技大学,未经北京信息科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210972465.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top