[发明专利]一种基于碳核查知识图谱的智能文件评审系统及方法在审
申请号: | 202310036553.1 | 申请日: | 2023-01-10 |
公开(公告)号: | CN116383414A | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 董真;陈甜甜;程凡;刘婧;杜凤青;赵林萱;李莉华;毕忠勤;张伟娜 | 申请(专利权)人: | 国网上海市电力公司;上海电力大学 |
主分类号: | G06F16/383 | 分类号: | G06F16/383;G06F16/33;G06F16/36;G06F40/289;G06F40/30;G06N3/044;G06N3/0895;G06Q50/26;G06N5/022 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 陈金星 |
地址: | 200122 上海市浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 核查 知识 图谱 智能 文件 评审 系统 方法 | ||
1.一种基于碳核查知识图谱的智能文件评审系统,其特征在于,包括:
文本数据获取模块,用于获取碳核查阶段的双碳文本数据;
知识图谱构建模块,用于基于所述双碳文本数据建立碳核查知识图谱;
评审模块,用于获取待评审的碳盘查报告并基于所述碳核查知识图谱进行文件评审。
2.根据权利要求1所述的一种基于碳核查知识图谱的智能文件评审系统,其特征在于,所述双碳文本数据包括国内外碳减排法规,国内外碳税、碳补贴政策,国内外碳排放标准,企业碳盘查报告。
3.根据权利要求1所述的一种基于碳核查知识图谱的智能文件评审系统,其特征在于,所述建立碳核查知识图谱包括以下步骤:
S01、双碳文本数据的预处理;
S02、识别并标注双碳文本数据中的实体;
S03、确定实体之间的关系;
S04、补齐实体修饰词;
S05、设定双碳文本三元组,进行三元组表示和归并;
S06、进行知识推理,丰富实体之间的关系。
4.根据权利要求3所述的一种基于碳核查知识图谱的智能文件评审系统,其特征在于,步骤S01具体为:
去除双碳文本数据的噪声信息,通过文本解析,从文本全文数据中提取出文件信息。
5.根据权利要求3所述的一种基于碳核查知识图谱的智能文件评审系统,其特征在于,步骤S02具体为:
构建BiLSTM网络作为实体识别模型,使用CRF对实体识别模型输出的标签加入约束和限制,构建训练集,使用训练集训练所述实体识别模型,得到训练好的实体识别模型;将双碳文本数据转化为句向量,使用所述实体识别模型识别并标注双碳文本数据中的实体。
6.根据权利要求3所述的一种基于碳核查知识图谱的智能文件评审系统,其特征在于,步骤S04中,对实体识别模型得到的实体的定语进行补充。
7.根据权利要求3所述的一种基于碳核查知识图谱的智能文件评审系统,其特征在于,步骤S05具体为:从语义层面为实体和关系设定模板,模板以外的三元组不加入到碳核查知识图谱中,使用Trans P为原始三元组嵌入向量,基于所得嵌入向量,使用平衡迭代削减层次聚类模型BIRCH进行三元组归并。
8.根据权利要求3所述的一种基于碳核查知识图谱的智能文件评审系统,其特征在于,步骤S06中,使用图结构构建路径,将路径进行向量化表示,将知识推理任务转换为决策问题,把实体和关系分别构建为状态空间和行动空间,通过实体游走进行状态的转换,补充实体之间的关系。
9.根据权利要求1所述的一种基于碳核查知识图谱的智能文件评审系统,其特征在于,基于所述碳核查知识图谱进行文件评审包括以下步骤:
T01、设定边界;
T02、从碳盘查报告中的排放设施和排放源清单文本中识别排放源;
T03、选择量化方法;
T04、从碳盘查报告中收集并核查活动数据;
T05、确定并核查活动数据;
T06、计算、汇总、核查排放量。
10.一种基于碳核查知识图谱的智能文件评审方法,其特征在于,基于如权利要求1-9中任一所述的智能文件评审系统,包括:
获取碳核查阶段的双碳文本数据;
基于所述双碳文本数据建立碳核查知识图谱;
获取待评审的碳盘查报告并基于所述碳核查知识图谱进行文件评审。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网上海市电力公司;上海电力大学,未经国网上海市电力公司;上海电力大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310036553.1/1.html,转载请声明来源钻瓜专利网。