[发明专利]一种基于多轮自动问答的电力技术标准实体关系抽取方法在审
申请号: | 202211618005.1 | 申请日: | 2022-12-15 |
公开(公告)号: | CN115795014A | 公开(公告)日: | 2023-03-14 |
发明(设计)人: | 王诗清;李广翱;高凤喜;王汀;徐凯;王阳;苑经纬;迟丹一;尚莹;张敏杰 | 申请(专利权)人: | 国网辽宁省电力有限公司电力科学研究院;无锡澎湃数智科技有限公司;国家电网有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06N20/00;G06Q50/06 |
代理公司: | 辽宁沈阳国兴知识产权代理有限公司 21100 | 代理人: | 何学军;李丛 |
地址: | 110006 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 自动 问答 电力 技术标准 实体 关系 抽取 方法 | ||
1.一种基于多轮自动问答的电力技术标准实体关系抽取方法,其特征在于,包括如下步骤:
步骤1.构建电力技术标准语料库;
步骤2.针对电力技术标准语料种类构建信息抽取要素模板;
步骤3.根据信息抽取要素模板,构建电力技术标准问答语料库;
步骤4.针对步骤1中所述的电力技术标准语料构建文本分类模块,其功能将问题分为四个大类,以便定位问题构建模板;
步骤5.针对步骤4中文本分类结果匹配信息抽取要素模板自动构建多轮问答与问题模块,将复杂问题拆分成简单问题,逐步进行推理回答;
步骤6.针对电力技术标准问答语料库构建机器阅读理解模块,来逐步推理解答步骤5自动构建的问题,完成一种基于多轮自动问答的电力技术标准实体关系抽取方法。
2.根据权利要求1所述的一种基于多轮自动问答的电力技术标准实体关系抽取方法,其特征在于,步骤1所述的构建电力技术标准语料库,是根据基层实际业务选取的电力技术标准,经过处理后,存储为语料数据。
3.根据权利要求1所述的一种基于多轮自动问答的电力技术标准实体关系抽取方法,其特征在于,步骤2所述针对电力技术标准语料种类构建信息抽取要素模板,是根据数据样本按照所包含的关键信息种类划分为抽取类、数字类、统计类和判断类,设定每个模板的抽取要素,为后续的电力技术标准问答语料库提供问题模板。
4.根据权利要求1所述的一种基于多轮自动问答的电力技术标准实体关系抽取方法,其特征在于,步骤3所述根据信息抽取要素模板,构建电力技术标准问答语料库,是为机器阅读理解模块在训练阶段提供训练预料,每个电力技术标准根据信息抽取要素模板生成多轮问答的问题作为输入,相应的实体关系作为答案,经过处理后,以问答对的形式存储为语料数据。
5.根据权利要求1所述的一种基于多轮自动问答的电力技术标准实体关系抽取方法,其特征在于,步骤4所述针对电力技术标准语料构建文本分类模块,是为预测输入文本中关键信息的所属类别,并与步骤2中所述信息抽取要素模板进行匹配,根据信息的所属类别,分配对应的信息抽取要素模板。
6.根据权利要求1所述的一种基于多轮自动问答的电力技术标准实体关系抽取方法,其特征在于,步骤5所述的对文本分类结果匹配信息抽取要素模板自动构建多轮问答与问题模块,是根据文本分类模块输出的语料类别,自动构建;在多轮问答阶段,模块首先抽取头实体,然后根据模板中设定抽取的尾实体类别、关系类别以及每轮问答获取的答案自动构建下一轮问答的问题,从而联合抽取关系与尾实体,当问答获取到多个答案时,需要在下一轮问答阶段遍历构建所有答案对应的问题。
7.根据权利要求1所述的一种基于多轮自动问答的电力技术标准实体关系抽取方法,其特征在于,步骤6所述的针对电力技术标准问答语料库构建机器阅读理解模块,是从输入样本中抽取问题对应的答案跨度,包括输入、输出、参数设定和评估标准。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网辽宁省电力有限公司电力科学研究院;无锡澎湃数智科技有限公司;国家电网有限公司,未经国网辽宁省电力有限公司电力科学研究院;无锡澎湃数智科技有限公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211618005.1/1.html,转载请声明来源钻瓜专利网。